当前位置：首页 > news >正文

第三章线性模型

news 2025/10/30 7:44:42

一、基本思想

定义：线性模型试图通过属性的线性组合进行预测：
或向量形式：
特点：
- 形式简单、可解释性强（权重 wi表示属性重要性）
- 许多非线性模型可在线性模型基础上引入层级结构或高维映射得到

二、线性回归

目标：预测实值输出标记
单变量情形：
- 使用最小二乘法求解 w 和 b
多变量情形：
广义线性模型：

三、对数几率回归（逻辑回归）：做分类

用途：二分类任务
核心思想：用对数几率函数（Sigmoid）将线性输出映射到 (0,1)(0,1)：
优势：
- 直接对分类概率建模
- 输出具有概率意义
- 是凸函数，易于优化
参数估计：使用极大似然估计，通过梯度下降或牛顿法求解

四、线性判别分析（LDA）：找最佳投影线

思想：将样本投影到一条直线上，使得：
- 同类样本的投影点尽可能接近
- 异类样本的投影点尽可能远离
目标函数（广义瑞利商）：

多分类推广：可扩展到多分类任务，并可用于监督降维

五、多分类学习策略

基本思路：将多分类任务拆解为多个二分类任务
三种经典策略：
1. OvO（一对一）：训练 N(N−1)/2N(N−1)/2 个分类器，通过投票决定类别
2. OvR（一对其余）：训练 NN 个分类器，选择置信度最高的
3. MvM（多对多）：如ECOC（纠错输出码），通过编码与解码容错

3. 多对多（MvM）

通俗解释：OvO和OvR都比较“极端”——要么是1v1，要么是1v全部。而MvM（RvR）则更加灵活：每次将一部分类别划为“正队”，另一部分类别划为“反队”，让这两个队伍进行PK。

核心步骤：

编码：设计多轮团队对抗赛。每一轮，都按照一个规则把3个类别分成“正队”和“反队”，训练一个分类器。
解码：一个新样本（新瓜）来的时候，让它参加所有这些“比赛”，看它在每一轮中被分到了“正队”还是“反队”，从而得到一个由（+1， -1）组成的“身份编码”。最后，看这个编码最像哪个类别的预设编码。

总结与对比

策略	形象比喻	核心思想	优点	缺点
OvO（一对一）	循环单挑赛	两两配对，训练多个分类器	训练每个分类器只用两类数据，相对简单	分类器数量多（N(N-1)/2）
OvR（一对其余）	海选+总决赛	一个类别 vs 其余所有类别	分类器数量少（N个）	每个分类器训练数据不均衡，训练难度大
MvM（多对多）	团队对抗赛	部分类别 vs 另一部分类别	设计灵活，有纠错能力	编码设计复杂，需要专业知识

六、类别不平衡问题

问题：不同类别的训练样本数差异大，导致模型偏向多数类
解决方法：
- 再缩放：调整决策阈值
- 欠采样：减少多数类样本
- 过采样：增加少数类样本（如SMOTE）
- 阈值移动：在决策过程中嵌入再缩放
与代价敏感学习的关系：将再缩放中的样本比例替换为误分类代价

http://www.dtcms.com/a/544548.html

相关文章：

【WordPress】Nova WordPress 主题：为内容创作者打造的极致体验

网站一般几年创新的沈阳网站建设

惠普电脑网站建设策划方案h5模板下载有哪些网站

怎么做网站seo山东省旅游网站建设

web网页，在线%抖音,舆情%分析系统demo，基于python+web+echart+nlp+知识图谱,数据库mysql

把浅色的pdf文件加深

Actix-Web 框架实战：构建高性能 RESTful API 服务

边缘计算中针对不同类型的任务（如分类、回归）评估指标

【16】C语言-编辑`task.json`文件以改变警告等级

Rust高性能优化与零拷贝技术深度实践

Linux-Redhat系统启动读取文件流程

React 10

京东方 EV101WXM-N10 工业液晶模组技术摘要

Deep End-to-End Alignment and Refinement for Time-of-Flight RGB-D modules复现

Java-163 MongoDB 生产安全加固实战：10 分钟完成认证、最小权限、角色详解

MinIO 与云原生_现代化对象存储解决方案

【C语言实战(63)】从0到1：51单片机GPIO控制实战秘籍

金仓替代MongoDB：互联网医院聊天脱敏实战

使用 ESLint + Prettier + Husky

mongodb备份脚本（单机+副本集）

金仓数据库平替MongoDB全栈安全实战：从文档存储到多模一体化的演进之路

基于k8s环境下mongodb备份恢复实战

申威ky10架构安装MongoDB 4.0.1（rpm包：mongodb-4.0.1-8.ky10.sw_64.rpm）详细步骤

网站建设开发语言和使用工具it培训套路

Diffusion Model与视频超分(2)：解读字节开源视频增强模型SeedVR2

Linux小课堂: 系统硬件资源管理与设备操作指南

ROS2核心概念之代码示例一

工厂考勤系统选型参考：如何选出最合适的方案

【前端小站】CSS 样式美学：从基础语法到界面精筑的实战宝典

Linux错误(7)接口处于Down状态不通告IPv6地址变更事件