当前位置: 首页 > news >正文

第三章 线性模型

一、基本思想

  • 定义:线性模型试图通过属性的线性组合进行预测:

    或向量形式:

  • 特点

    • 形式简单、可解释性强(权重 wi表示属性重要性)

    • 许多非线性模型可在线性模型基础上引入层级结构或高维映射得到

二、线性回归

  • 目标:预测实值输出标记

  • 单变量情形

    • 使用最小二乘法求解 w 和 b

  • 多变量情形

  • 广义线性模型

三、对数几率回归(逻辑回归):做分类

  • 用途:二分类任务

  • 核心思想:用对数几率函数(Sigmoid)将线性输出映射到 (0,1)(0,1):

  • 优势

    • 直接对分类概率建模

    • 输出具有概率意义

    • 是凸函数,易于优化

  • 参数估计:使用极大似然估计,通过梯度下降或牛顿法求解

四、线性判别分析(LDA):找最佳投影线

  • 思想:将样本投影到一条直线上,使得:

    • 同类样本的投影点尽可能接近

    • 异类样本的投影点尽可能远离

  • 目标函数(广义瑞利商):

  • 多分类推广:可扩展到多分类任务,并可用于监督降维

五、多分类学习策略

  • 基本思路:将多分类任务拆解为多个二分类任务

  • 三种经典策略

    1. OvO(一对一):训练 N(N−1)/2N(N−1)/2 个分类器,通过投票决定类别

    2. OvR(一对其余):训练 NN 个分类器,选择置信度最高的

    3. MvM(多对多):如ECOC(纠错输出码),通过编码与解码容错

3. 多对多(MvM)

通俗解释:OvO和OvR都比较“极端”——要么是1v1,要么是1v全部。而MvM(RvR)则更加灵活:每次将一部分类别划为“正队”,另一部分类别划为“反队”,让这两个队伍进行PK。

        核心步骤:

  1. 编码:设计多轮团队对抗赛。每一轮,都按照一个规则把3个类别分成“正队”和“反队”,训练一个分类器。

  2. 解码:一个新样本(新瓜)来的时候,让它参加所有这些“比赛”,看它在每一轮中被分到了“正队”还是“反队”,从而得到一个由(+1, -1)组成的“身份编码”。最后,看这个编码最像哪个类别的预设编码。

总结与对比

策略形象比喻核心思想优点缺点
OvO(一对一)循环单挑赛两两配对,训练多个分类器训练每个分类器只用两类数据,相对简单分类器数量多(N(N-1)/2)
OvR(一对其余)海选+总决赛一个类别 vs 其余所有类别分类器数量少(N个)每个分类器训练数据不均衡,训练难度大
MvM(多对多)团队对抗赛部分类别 vs 另一部分类别设计灵活,有纠错能力编码设计复杂,需要专业知识

六、类别不平衡问题

  • 问题:不同类别的训练样本数差异大,导致模型偏向多数类

  • 解决方法

    • 再缩放:调整决策阈值

    • 欠采样:减少多数类样本

    • 过采样:增加少数类样本(如SMOTE)

    • 阈值移动:在决策过程中嵌入再缩放

  • 与代价敏感学习的关系:将再缩放中的样本比例替换为误分类代价

http://www.dtcms.com/a/544548.html

相关文章:

  • 【WordPress】Nova WordPress 主题:为内容创作者打造的极致体验
  • 网站一般几年创新的沈阳网站建设
  • 惠普电脑网站建设策划方案h5模板下载有哪些网站
  • 怎么做网站seo山东省旅游网站建设
  • web网页,在线%抖音,舆情%分析系统demo,基于python+web+echart+nlp+知识图谱,数据库mysql
  • 把浅色的pdf文件加深
  • Actix-Web 框架实战:构建高性能 RESTful API 服务
  • 边缘计算中针对不同类型的任务(如分类、回归)评估指标
  • 【16】C语言-编辑`task.json`文件以改变警告等级
  • Rust高性能优化与零拷贝技术深度实践
  • Linux-Redhat系统启动读取文件流程
  • React 10
  • 京东方 EV101WXM-N10 工业液晶模组技术摘要
  • Deep End-to-End Alignment and Refinement for Time-of-Flight RGB-D modules复现
  • Java-163 MongoDB 生产安全加固实战:10 分钟完成认证、最小权限、角色详解
  • MinIO 与云原生_现代化对象存储解决方案
  • 【C语言实战(63)】从0到1:51单片机GPIO控制实战秘籍
  • 金仓替代MongoDB:互联网医院聊天脱敏实战
  • 使用 ESLint + Prettier + Husky
  • mongodb备份脚本(单机+副本集)
  • 金仓数据库平替MongoDB全栈安全实战:从文档存储到多模一体化的演进之路
  • 基于k8s环境下mongodb备份恢复实战
  • 申威ky10架构安装MongoDB 4.0.1(rpm包:mongodb-4.0.1-8.ky10.sw_64.rpm)详细步骤
  • 网站建设开发语言和使用工具it培训套路
  • Diffusion Model与视频超分(2):解读字节开源视频增强模型SeedVR2
  • Linux小课堂: 系统硬件资源管理与设备操作指南
  • ROS2核心概念之代码示例一
  • 工厂考勤系统选型参考:如何选出最合适的方案
  • 【前端小站】CSS 样式美学:从基础语法到界面精筑的实战宝典
  • Linux错误(7)接口处于Down状态不通告IPv6地址变更事件