当前位置: 首页 > news >正文

05 回归问题和分类问题

我们用通俗易懂的话 + 数学公式 + 生活例子,彻底讲清楚回归和分类的区别。


🎯 核心一句话区别:

  • 回归问题:预测一个具体的数字(连续值),比如“明天气温是多少度?”
  • 分类问题:预测一个类别标签(离散的选项),比如“这封邮件是不是垃圾邮件?”

1 回归问题(Regression)

✅ 大白话:

你要猜的是一个具体的数值,这个数可以是小数、整数,范围很广。比如房价、体重、温度、销售额等。

📐 数学公式:

模型的目标是学习一个函数 fθf_\thetafθ,使得:

y^i=fθ(xi) \hat{y}_i = f_\theta(x_i) y^i=fθ(xi)

其中:

  • xix_ixi 是输入(比如房子面积、地段)
  • y^i\hat{y}_iy^i 是输出,是一个连续的实数(比如预测房价 350.8 万元)

损失函数常用:均方误差(MSE)
MSE=1n∑i=1n(yi−y^i)2 \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 MSE=n1i=1n(yiy^i)2
意思是:预测值和真实值之间的平方差越小越好。

🏠 举例:预测房价

房子面积(㎡)地段评分真实房价(万元)模型预测房价(万元)
807320318.5
1209540542.1

👉 模型的任务就是不断调整自己,让预测的数字(如 318.5)尽量接近真实数字(320)。


2 分类问题(Classification)

✅ 大白话:

你要猜的是“这是什么类型”,答案是几个固定的选项之一。比如“是或不是”、“猫 or 狗”、“高中低风险”。

📐 数学公式:

模型输出的通常是一个概率分布,表示属于每个类别的可能性。

比如二分类问题(是/否):
P(yi=1∣xi)=σ(fθ(xi))=11+e−fθ(xi) P(y_i=1|x_i) = \sigma(f_\theta(x_i)) = \frac{1}{1 + e^{-f_\theta(x_i)}} P(yi=1∣xi)=σ(fθ(xi))=1+efθ(xi)1

其中:

  • fθ(xi)f_\theta(x_i)fθ(xi) 是模型算出的一个分数
  • σ\sigmaσSigmoid 函数,把分数变成 0~1 之间的概率
  • 输出 P(yi=1∣xi)P(y_i=1|x_i)P(yi=1∣xi) 表示“属于类别1”的概率

最终判断:如果概率 > 0.5,就判为“是”;否则判为“否”。

多分类常用 Softmax 函数。

损失函数常用:交叉熵损失(Cross-Entropy)
Loss=−∑iyilog⁡(y^i) \text{Loss} = - \sum_{i} y_i \log(\hat{y}_i) Loss=iyilog(y^i)
意思是:真实类别对应的预测概率越大越好。

📧 举例:判断是否为垃圾邮件

邮件内容关键词真实标签模型预测概率(是垃圾邮件)判定结果
“免费领取大奖!”是(1)0.93
“项目进度汇报”否(0)0.12

👉 模型不是直接输出“是”或“否”,而是先算出一个概率,再根据阈值做决定。


🔁 总结对比表

项目回归问题分类问题
输出类型连续数值(如 3.14, 100.5)离散标签(如 是/否,猫/狗)
目标预测具体数值判断属于哪个类别
典型任务房价预测、气温预报、销量预估垃圾邮件识别、图像分类、疾病诊断
损失函数均方误差(MSE)交叉熵损失(Cross-Entropy)
输出层通常无激活或线性激活Sigmoid(二分类)、Softmax(多分类)

💡 形象比喻:

  • 回归:像用尺子量身高——结果是一个精确的数字(175.3 cm)。
  • 分类:像投票选班长——只能从几个人里选一个。

文章转载自:

http://mPlT3sym.fgLyb.cn
http://kDxguRSO.fgLyb.cn
http://Vt3QPRvX.fgLyb.cn
http://ME1osVtV.fgLyb.cn
http://VoKcN70T.fgLyb.cn
http://PqhfqcQ9.fgLyb.cn
http://MwA2oXOP.fgLyb.cn
http://oxi3gh83.fgLyb.cn
http://m0SD5zM1.fgLyb.cn
http://CTOzZ3vo.fgLyb.cn
http://1CqV5cEz.fgLyb.cn
http://YpmUs14s.fgLyb.cn
http://q9QDSb1j.fgLyb.cn
http://TFEP6QiA.fgLyb.cn
http://tkjSjuH6.fgLyb.cn
http://RSdOoq4Z.fgLyb.cn
http://4V907EXj.fgLyb.cn
http://qs94xQNC.fgLyb.cn
http://pJYRMZkM.fgLyb.cn
http://3AnclcKo.fgLyb.cn
http://VOOB0FtQ.fgLyb.cn
http://4pZzIUlN.fgLyb.cn
http://LDL9wOVx.fgLyb.cn
http://If2go4DA.fgLyb.cn
http://wJr7ex2q.fgLyb.cn
http://HqHt4dMQ.fgLyb.cn
http://VACTlq7U.fgLyb.cn
http://OV8QVSZT.fgLyb.cn
http://vub9tcFa.fgLyb.cn
http://Jeh0QkbC.fgLyb.cn
http://www.dtcms.com/a/381823.html

相关文章:

  • Linux应用(4)——进程通信
  • 用C语言解决喝汽水问题
  • 【开题答辩全过程】以 4S店汽车维修保养管理系统为例,包含答辩的问题和答案
  • 边缘计算技术深入解析
  • 三生原理的“素性塔“结构是否暗含共形场论中的算子乘积展开层级?‌
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘cugraph’问题
  • 评估硬件兼容性时如何快速判断老旧设备是否支持新协议
  • [2025]使用echarts制作一个漂亮的天气预报曲线图
  • 每日算法题推送
  • DataSet-深度学习中的常见类
  • Python编辑器的安装及配置(Pycharm、Jupyter的安装)从0带你配置,小土堆视频
  • SystemVerilog 学习之SystemVerilog简介
  • 中国联通卫星移动通信业务分析
  • 学习游戏制作记录(实现震动效果,文本提示和构建游戏)9.13
  • 【CMake】循环——foreach(),while()
  • 对比Java学习Go——函数、集合和OOP
  • AI时代的内容创作革命:深度解析xiaohongshu-mcp项目的技术创新与实战价值
  • 3-11〔OSCP ◈ 研记〕❘ WEB应用攻击▸存储型XSS攻击
  • 贪心算法应用:配送路径优化问题详解
  • 神经网络稀疏化设计构架中的网络剪枝技术:原理、实践与前沿探索
  • p5.js 绘制 3D 椭球体 ellipsoid
  • Qt中自定义控件的三种实现方式
  • leetcode34(环形链表)
  • Jupyter Notebook 介绍、安装及使用
  • 高并发场景下限流算法实践与性能优化指南
  • 基于stm32的智能井盖系统设计(4G版本)
  • 考研408计算机网络第36题真题解析(2021-2023)
  • 【Linux系统】单例式线程池
  • FreeSWITCH一键打包Docker镜像(源码编译)
  • POI和EasyExcel