当前位置: 首页 > news >正文

第3周 机器学习课堂记录

1.学习问题的分类

  • 有监督的学习
    • 分类
    • 回归
  • 无监督学习
    • 聚类
    • 密度估计:确定输入空间中的数据的分布
    • 可视化:把高位空间中的数据投影到二维或三维空间
  • 强化学习
    • 不给定最优输出的示例,而是通过试错发现最优输出

2.泛化versus过度拟合

背景引入:多项式曲线拟合

目标函数:y(X,W) = W^TX

损失函数:最小平方和\tilde{E}(\mathbf{w}) = \frac{1}{2} \sum_{i=1}^{N} \left\{ y(x_i, \mathbf{w}) - t_i \right\}^2

  • 泛化:正确预测不同于用于训练的数据的新观察的能力
  • 过拟合:目标函数的模型y过度拟合训练数据,如果存在一个可选的模型y‘满足error_D(y) < error_D(y')
    但是
    error(y) > error(y')
    其中,error_D(y)是训练数据上的误差,而error是整个数据分布上的误差
  • 欠拟合

3.用于模型比较的测试集

  • 测试集:一个独立的数据集,可以获得泛化性能对M的依赖的一些定量的领悟。
  • root-mean-square(RMS) error 均方根误差
    • E_{RMS} = \sqrt{2E(w)/N}
    • 除以N使得我们能够在平等的基础上比较不同大小的数据集
    • 开放确保E_{RMS}与目标变量t具有同样的尺度和量纲

4.Regularization正则化

  • 一种常用于控制过拟合现象的技术
  • 给误差函数添加一个惩罚项,以阻止系数达到大的值
    • \tilde{E}(\mathbf{w}) = \frac{1}{2} \sum_{i=1}^{N} \left\{ y(x_i, \mathbf{w}) - t_i \right\}^2 + \frac{\lambda}{2} \left\| \mathbf{w} \right\|^2
    • 其中\left\| \mathbf{w} \right\|^2 \equiv \mathbf{w}^\mathrm{T} \mathbf{w} = w_0^2 + w_1^2 + \dots + w_M^2
    • 并且系数λ控制正则化项与平方和误差项相比的相对重要性。

5.验证集

达成模型复杂度的适合的值的一种简单方法,通过把可用的数据划分成:

  • 一个训练集,用于确定系数w
  • 一个验证集,也叫做hold-out set,用于优化模型复杂度(要么M,要么λ)

训练集:确定模型参数w

测试集:评价模型泛化性质

验证集:调节模型超参M

y(X,W) = w_0 + w_1x + ... + w_Mx^M


6.Gaussian Distribution 高斯分布

单个实值变量x的情形,高斯分布定义为

\mathcal{N}(x|\mu,\sigma^2) = \frac{1}{(2\pi\sigma^2)^{1/2}} \exp\left\{ -\frac{1}{2\sigma^2}(x - \mu)^2 \right\}

式中 \mu 是均值(mean),\sigma^2 是方差(variance),方差的平方根 \sigma叫做标准误(standard deviation),方差的倒数 \beta(\beta=1/\sigma^2) 叫做精度(precision)。


7.Gaussian Parameter Estimation

  • 数据集 \mathcal{X} = (x_1, \dots, x_N)^{\mathrm{T}},表示标量x的N个观察。
  • 数据独立地从同一个高斯分布采样得到,均值和方差未知。
  • 利用数据集确定高斯分布的参数。
  • 由于数据集\mathcal{X}独立同分布,因此,给定μ和方差σ2,数据集的概率(似然)
    • p(\mathcal{X}|\mu, \sigma^2) = \prod_{i=1}^{N} \mathcal{N}(x_i|\mu, \sigma^2)

8.Maximum(Log) Likelihood 最大似然估计

  • 对数似然函数
    • \ln p(\mathcal{X}|\mu, \sigma^2) = -\frac{1}{2\sigma^2} \sum_{i=1}^{N} (x_i - \mu)^2 - \frac{N}{2} \ln \sigma^2 - \frac{N}{2} \ln 2\pi
  • 最大似然解
    • 样本均值  \mu_{\text{ML}} = \frac{1}{N} \sum_{i=1}^{N} x_i
    • 样本方差 \sigma_{\text{ML}}^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu_{\text{ML}})^2

9.Limitations of the Maximum Likelihood Approach

  • 系统地低估分布的方差
    • E[\mu_{\text{ML}}] = \mu
    • E[\sigma_{\text{ML}}^2] = \frac{N - 1}{N} \sigma^2  (有估计偏差)
  • 和过拟合有密切关系

文章转载自:

http://LvlreB4K.jjzrh.cn
http://Y6yGFeCK.jjzrh.cn
http://p198gVkX.jjzrh.cn
http://betggu7r.jjzrh.cn
http://CVm1gbHC.jjzrh.cn
http://WTbFcY64.jjzrh.cn
http://hzIkXF39.jjzrh.cn
http://MezAifQo.jjzrh.cn
http://VqYFuoOR.jjzrh.cn
http://gZ2ujEJB.jjzrh.cn
http://3MuqmqFi.jjzrh.cn
http://KErvJCYR.jjzrh.cn
http://oX3AG0R0.jjzrh.cn
http://DoeD7CL1.jjzrh.cn
http://YzcakZbU.jjzrh.cn
http://JcMxEFxm.jjzrh.cn
http://Oxlpjxdo.jjzrh.cn
http://qpFrnSnT.jjzrh.cn
http://L7kuvH4V.jjzrh.cn
http://su7A6916.jjzrh.cn
http://hf3nwipj.jjzrh.cn
http://yZ0c0myL.jjzrh.cn
http://HKWSyYDJ.jjzrh.cn
http://xV4JE8i4.jjzrh.cn
http://7p7gXMda.jjzrh.cn
http://ZJpHQn8J.jjzrh.cn
http://RpOkyrCl.jjzrh.cn
http://vNsyg8TU.jjzrh.cn
http://feKsZVfs.jjzrh.cn
http://3iVnMWVT.jjzrh.cn
http://www.dtcms.com/a/374468.html

相关文章:

  • 机器学习、深度学习与大模型:技术选型的思考与实战指南
  • 深度学习(四):数据集划分
  • Python最新的好用技巧和特性总结
  • 看不见的安全防线:信而泰仪表如何验证零信任有效性
  • PyQt 界面布局与交互组件使用指南
  • 资产 OCR 识别:批量导入效率提升指南
  • 萝卜切丁机 机构笔记
  • Java学习笔记三(封装)
  • 使用云手机能否给企业降本增效
  • Linux笔记---进程间关系与守护进程
  • 详细:虚拟机 + Linux 环境搭建 + Oracle 11.2.0 EE 安装全流程
  • 思利普科技:用BCG心冲击技术重新定义睡眠监测,掀起床垫行业智能化革命
  • 2025世界智博会,揭幕AI触手可及的科幻生活
  • 探索 CSS 3D 属性:从基础到炫酷动画案例
  • “从零到一:使用GitLab和Jenkins实现自动化CI/CD流水线”
  • 考研408《计算机组成原理》复习笔记,第六章(1)——总线概念
  • adb的常用命令
  • 设计模式:策略模式
  • 【华为OD】数字游戏
  • 分享:一种为蓝牙、WIFI、U段音频发射设备提供ARC回传数字音频桥接功能的方案
  • 【设计模式】 外观模式
  • 在 JavaScript中使用msgpack-lite 和zlib实现大数据文件的压缩和读取
  • 医疗连续体机器人模块化控制界面设计与Python库应用研究(中)
  • 【数据库】Redis详解:内存数据库与缓存之王
  • OpenCV 图像处理实战:从图像金字塔到直方图分析
  • MongoDB 安全加固:构建企业级纵深防御体系——用户权限管理与 TLS 加密配置详解
  • 为什么苹果签名经常会掉签?
  • http basic认证流程
  • Docker 存储卷(Volume)核心概念、类型与操作指南
  • 【iOS】 单例模式