当前位置: 首页 > news >正文

丰镇市网站开发者模式打开有什么影响

丰镇市网站,开发者模式打开有什么影响,网站建设和管理培训,绍兴公司网站建设上一章:机器学习04——决策树 下一章:机器学习06——支持向量机 机器学习实战项目:【从 0 到 1 落地】机器学习实操项目目录:覆盖入门到进阶,大学生就业 / 竞赛必备 文章目录一、多分类学习(一)…

上一章:机器学习04——决策树
下一章:机器学习06——支持向量机
机器学习实战项目:【从 0 到 1 落地】机器学习实操项目目录:覆盖入门到进阶,大学生就业 / 竞赛必备

文章目录

      • 一、多分类学习
        • (一)一对一(One vs. One, OvO)
        • (二)一对其余(One vs. Rest, OvR)
        • (三)两种策略的比较
        • (四)多对多(Many vs. Many, MvM)
      • 二、类别不平衡问题
        • (一)再缩放(Rescaling)
        • (二)采样方法
        • (三)阈值移动(Threshold-moving)
        • (四)方法选择

一、多分类学习

多分类学习旨在解决类别数大于2的分类问题,核心思路是通过任务拆分将多分类问题转化为多个二分类问题,再集成二分类器的结果得到最终分类。常见的拆分策略包括一对一、一对其余和多对多。
在这里插入图片描述

(一)一对一(One vs. One, OvO)
  • 任务拆分:将N个类别两两配对,生成N(N−1)/2N(N-1)/2N(N1)/2个二分类任务(如类别C1C_1C1C2C_2C2C1C_1C1C3C_3C3等),每个任务仅使用对应两个类别的样本训练分类器,最终得到N(N−1)/2N(N-1)/2N(N1)/2个分类器。
  • 测试阶段:将新样本输入所有分类器,每个分类器会判定样本属于两个类别中的一个,通过“投票”机制确定最终类别——被预测次数最多的类别即为结果。
  • 特点:每个分类器的训练仅使用两个类的样本,训练时间较短,但需训练和存储的分类器数量多(如10个类别需45个分类器),存储和测试开销较大。
(二)一对其余(One vs. Rest, OvR)
  • 任务拆分:为每个类别构建一个二分类任务,将该类别视为“正例”,其余所有类别视为“反例”,共生成N个二分类任务,训练得到N个分类器。
  • 测试阶段:将新样本输入所有分类器,每个分类器会输出样本属于其对应“正例”类别的置信度,选择置信度最大的类别作为最终结果。
  • 特点:分类器数量少(N个),存储和测试开销小,但每个分类器的训练需使用全部样本(正例少、反例多),训练时间较长,且可能因类别不平衡影响单个分类器性能。
(三)两种策略的比较
  • 性能:在多数情况下,OvO和OvR的预测性能相近,具体取决于数据分布。
  • 效率:OvO的训练时间更短(单个分类器样本少),但存储和测试开销更大;OvR则相反,适合类别数较多的场景。
(四)多对多(Many vs. Many, MvM)
  • 核心思想:通过预设的“类别子集”划分任务,每个任务将一部分类别作为正例,另一部分作为反例(如利用纠错输出码机制,为每个类别分配唯一的二进制编码,通过多个二分类器学习编码的每一位)。
  • 特点:能更好地利用类别间的关联信息,抗噪声能力较强,但任务设计较复杂,实际应用中不如OvO和OvR广泛。

二、类别不平衡问题

类别不平衡指训练集中不同类别的样本数量相差悬殊(如正例仅占10%,反例占90%),可能导致分类器偏向多数类,忽视少数类。常见解决方法包括再缩放、采样和阈值移动。

(一)再缩放(Rescaling)
  • 原理:基于贝叶斯决策理论,调整分类阈值。对于二分类问题,若正例先验概率为p+p_+p+、反例为p−p_-p,最优决策应满足y1−y>p−p+\frac{y}{1-y} > \frac{p_-}{p_+}1yy>p+p(其中yyy为样本属于正例的预测概率)。当训练集类别不平衡时(如正例样本数m+m^+m+、反例m−m^-m),可用m−m+\frac{m^-}{m^+}m+m近似p−p+\frac{p_-}{p_+}p+p,调整决策阈值。
(二)采样方法
  1. 欠采样(Undersampling):通过移除部分多数类(反例)样本,使正反例数量接近。例如EasyEnsemble算法,多次随机采样多数类样本与少数类组成训练集,训练多个分类器后集成,避免因单次采样丢失重要信息。
  2. 过采样(Oversampling):通过增加少数类(正例)样本,平衡类别比例。例如SMOTE算法,基于少数类样本的近邻生成“虚拟样本”,避免简单复制样本导致的过拟合。
(三)阈值移动(Threshold-moving)
  • 原理:不改变训练数据,直接调整分类器的决策阈值。例如,当正例样本少而反例多时,降低正例的判定阈值(如将默认的0.5调整为0.3),使分类器更“容易”将样本判定为正例,从而平衡对少数类的识别率。
(四)方法选择
  • 小规模数据集优先考虑过采样(避免信息丢失);
  • 大规模数据集可采用欠采样(减少计算开销);
  • 阈值移动常与采样结合使用,进一步优化分类器对少数类的敏感性。

上一章:机器学习04——决策树
下一章:机器学习06——支持向量机
机器学习实战项目:【从 0 到 1 落地】机器学习实操项目目录:覆盖入门到进阶,大学生就业 / 竞赛必备

http://www.dtcms.com/a/572250.html

相关文章:

  • 做服装团购网站做淘口令网站
  • 传媒公司网站移动网站视频主持人网
  • 下载网站系统十大计算机培训机构排名
  • 企业网站建设流程介绍做招商加盟做得比较好的网站
  • 网站怎么做网上报名注册网站获取网易邮箱安全码
  • 中国建设银行招聘信息网站6班级网站怎么做网页制作
  • 网站备案变更主体收钱码合并的网站怎么做
  • 网站备案 互联网信息查询嘉兴网站建设费用
  • 佛山企业网站建设策划工商局加强网站建设的通知
  • 网络营销推广的主要形式为seo在线优化
  • 首钢建设网站免费网页在线代理服务
  • 景县住房和城乡规划建设局网站硬件开发流程图
  • 设计坞广州做网站优化
  • 长沙网站seo多少钱huntt wordpress主题
  • 文案网站策划书汕头市专注网站建设
  • asp做的网站如何更新淘宝客的网站是如何建设的
  • 韩城做网站服务器上怎么做网站
  • 西安建设教育网站wordpress适用于任何网站吗
  • 如何做网站的后台管理温州哪里做网站比较好
  • 企业门户网站模式企业宣传网
  • 一般ps做网站大小多少自己制作手机网站
  • 网站如何做线上支付功能网站排名下降
  • 注册网站会有哪些风险手机网站建设技术
  • 企业网站定制开发流程已有网站可以做服务器吗
  • 网站建设的好处和目的seo工具排行榜
  • 陕西住房建设厅考试官方网站郑州做网站服务器
  • 网站平台建设步骤企业公司建设网站
  • 京东商城网站域名怎么制作图片模板
  • 沧州网站设计报价大气腐蚀网站建设
  • 网站高端制作app软件需要用到哪些技术