当前位置：首页 > news >正文

吴恩达 Machine Learning（Class 2）

news 2025/8/19 10:32:39

Week 1

1.1 Neural networks

Model

几个概念：输入、隐藏、输出层，激活值，特征向量 x；

神经网络在图像识别中的作用：从细节组合到特征，再从特征组合成完整的图像；

Layers

方括号内的值 i 表示这是与第 i 层有关的数据，上一层的输出就是下一层的输入；

Tensor

注意：两层括号代表的才是二维张量；

1.2 Forward Propagation

前向传播：

单个网络层上的前向传播：这里没有采用张量计算；

Week 2

2.1 Activation function

ReLU

不同的激活函数：

How to choose

输出层：二分类用 sigmoid，结果有正有负用线性，只有正用 ReLU；

隐藏层：只推荐用 ReLU，相比与 sigmoid 计算速度更快（一是计算公式简单，二是函数只有一边是平的，这两个原因导致的速度更快）

Why we need

如果每一层都使用线性回归，最后也就相当于计算了一层线性回归而已，所以隐藏层推荐用 ReLU；

2.2 Multi-class Clssification

Softmax Regression

多分类的回归函数：

Cross Entropy Loss

交叉熵损失：

Softmax output

在其它激活函数中，ai 是 zi 的函数，而在这个激活函数中，ai 是 [z1 - zn] 的函数；

2.3 Multi-label Clssification

多标签分类问题：

Difference

多标签得到的结果是不同类别的独立概率，而多分类是同类别的相关概率；

2.4 Adam algorithm

Advantage

和梯度下降算法不一样，Adam 算法可以根据下降方向的变化，动态地调整学习率的大小；

每个变量前的学习率都不一样：

2.5 Convenlutional Neural Network

Convenlutional Layer

卷积层：一层中的某个神经元只选择 x 的一部分作为输入；

卷积神经网络：

Week 3

3.1 Choosing Model

本质：选择几个模型进行训练，然后用交叉验证集对几个模型进行损失值评估，以此选出最好的模型，再通过测试集新数据评估该模型泛化误差；

Test set

将数据集拆分为训练集，测试集：

计算测试集的损失（损失计算不包含正则化这一项），来评估训练结果：

分类问题同理：

Cross validation set

交叉验证集（验证集，开发集）：计算该集合损失，选择最合适的模型；

三种集合计算损失方法相同：

3.2 Diagnosing model

Bias / variance

高偏差：模型在训练数据上表现不好；
高方差：模型在训练数据上表现很好，但在新数据（交叉验证集）上表现较差；

训练集损失，交叉验证集损失在不同维度的模型下的大小变化：

Lambda

如何选择 $\lambda$ ：

训练集损失，交叉验证集损失在不同 $\lambda$ 的模型下的大小变化：

Performance Evaluation

评估模型性能首先得知道基准水平，比如声音识别中人类可以达到的准确率：

再根据三者的差值进行分析是高偏差，还是高方差：

3.3 Learning curves

学习曲线：训练集大小对损失的影响；

High bias

在只有调整训练集大小的操作中，如果存在高偏差，那么增加训练集作用很小；

High variance

在只有调整训练集大小的操作中，如果存在高方差，那么增加训练集作用比较大；

Summary

解决高偏差，高方差的方法总结：

Bias/variance in Neural networks

神经网络中遇到高偏差，高方差的解决方法：

在神经网络中，只要选择了合适的正则化，那么增加神经网络层数通常都能减小偏差；

3.4 Getting Data

Data augmentation

数据增强：根据原有的数据去修饰成新的数据；

图像识别，语言识别中的数据增强：

合成数据：

Transfer learning

迁移学习：应用场景是你的手写识别数据集不够，而其他猫狗数据集足够的情况下，用别人已经做好的模型更换输出层做预训练；

迁移学习需要预训练模型的输入和我们所需的相同，如文本、音频等；
底层原理就是神经网络的隐藏层是由边缘到角落慢慢地构建框架的，可以套用；

3.5 Skewed Datasets

倾斜数据集：这里的意思是这种病是一种罕见病，在人群中只有0.5%的发病率，所以我的模型预测没病的概率是100%，这样的话我的模型准确率还有99.5%；
由于 99.5% 准确率的模型只会判断为无病，所以准确率低一点的模型反而可以检测出一些有病的情况；

Precision / recall

精确率与召回率：两者都较高的模型拟合的更好；
精确率：预测为 1，且确实为 1 的概率；
召回率：事实为 1，且预测为 1 的概率；

Trading off precision and recall

权衡精确率和召回率：当希望预测的更准确，则设置阈值变大，此时精确率上升、召回率下降，反之同理；

F1 score

选取调和平均数更大的模型：

Week 4

4.1 Decision Trees

决策树：类似二叉树；

Learning Process

第一步：决定结点处选取什么特征进行分裂；

第二步：决定什么时候停止分裂；

Purity

纯度：利用熵函数进行计算，在比例为 0.5 时纯度最低，也就是熵最小；

Choosing a split

熵的减少称为信息增益（information gain），选取信息增益最大的分裂方式；
这里处理两边熵值的方法为加权平均数，因为熵更大的数地位更高：

根据前面的方法进行递归构建决策树：

One-hot encoding

独热编码：当某个特征具有两个以上特征值时（设为3），将其转化为3个单独特征进行分裂，分别用 0，1 对是否含有该特征进行赋值；

Continuous variable

如果某个特征是可以去连续值的，则分类根本是计算权重，选取不同值的权重计算信息增益，选择信息增益最大处的权重作为分类标准；

4.2 Regression Trees

Regression with Decision Trees

利用决策树解决回归问题：预估一只动物的体重；

Choosing a split

这里采用的是计算方差的加权平均数，再计算信息增益，选取增益最大的方式分裂：

4.3 Tree ensemble

使用多个决策树，通过所有决策树最后的投票结果，预测该动物类别：

Sampling with replacement

有放回抽样：可以不断构建新的数据集；

4.4 Random forest algorithm

Bagged decision tree

袋装决策树：利用有放回取样方法，搭建大约100个决策树（通常取64/128，太大会过拟合）
由于这种方法还是会有在根节点处分类相似的情况出现，因此提出了随机森林算法；

Random forest

随机森林算法：在某个结点处，若有 n 个特征可以使用，则随机挑选 k 个特征作为子集，再让结点从中挑选（最常见的是 k = $\sqrt{n}$ ）；

4.5 XGBoost

Boosted Trees

提升树：通过组合多个决策树，逐步修正错误；
核心：每次建立新的数据集都会有更高的概率选择那些之前采样的表现不佳的样本；

eXtreme Gradient Boosting

XGBoost （极端梯度提升），它通过逐步构建一系列的决策树，每棵树都在之前树的残差（误差）上进行训练，从而逐步改进预测结果。每棵树的作用是纠正前一棵树的错误，最后通过加权求和得到最终的预测结果。
优势：1.内置了正则化功能防止过拟合；2.不是通过替换进行采样，而是为不同的训练样本分配不同的权重；

4.6 Decision Trees and Neural Networks

如何选择决策树还是神经网络：决策树多用于结构化数据且速度快，而神经网络适用各种结构但是速度较慢；

查看全文

http://www.dtcms.com/a/338010.html

数字时代著作权侵权：一场资本与法律的博弈

「Flink」业务搭建方法总结

嵌入式设备Lwip协议栈实现功能

摔倒检测数据集：1w+图像，yolo标注

02.Linux基础命令

8.18 机器学习-决策树（1）

docker部署flask并迁移至内网

Zephyr下控制ESP32S3的GPIO口

RK3568 NPU RKNN（六）：RKNPU2 SDK

FlycoTabLayout CommonTabLayout 支持Tab选中字体变大选中tab的加粗效果首次无效的bug

探索性测试：灵活找Bug的“人肉探测仪”

前端大文件分片下载上传

宝塔面板多Python版本管理与项目部署

excel表格 Vue3（非插件）

day25｜学习前端js

Linux: RAID（磁盘冗余阵列）配置全指南

损失函数与反向传播小土堆pytorch记录

FPGA-Vivado2017.4-建立AXI4用于单片机与FPGA之间数据互通

计算机组成原理(9) - 整数的乘除法运算

js计算两个经纬度之间的角度

Python字符串连接与合并工程实践：从基础到高性能解决方案

【笔记】位错的定义和分类

B站韩顺平笔记（Day 22）

【人工智能】2025年AI代理失控危机：构建安全壁垒，守护智能未来

规避(EDR)安全检测--避免二进制文件落地

面向对象爬虫进阶：类封装实现高复用爬虫框架

DP-v2.1-mem-clean学习（3.6.9-3.6.12）

Python 爬虫实战：玩转 Playwright 跨浏览器自动化（Chromium/Firefox/WebKit 全支持）

嵌入式第三十二课！！线程间的同步机制与进程间的通信（IPC机制）

PotPlayer使用AI生成字幕和API实时翻译

Week 1

1.1 Neural networks

Model

Layers

Tensor

1.2 Forward Propagation

Week 2

2.1 Activation function

ReLU

How to choose

Why we need

2.2 Multi-class Clssification

Softmax Regression

Cross Entropy Loss

Softmax output

2.3 Multi-label Clssification

Difference

2.4 Adam algorithm

Advantage

2.5 Convenlutional Neural Network

Convenlutional Layer

Week 3

3.1 Choosing Model

Test set

Cross validation set

3.2 Diagnosing model

Bias / variance

Lambda

Performance Evaluation

3.3 Learning curves

High bias

High variance

Summary

Bias/variance in Neural networks

3.4 Getting Data

Data augmentation

Transfer learning

3.5 Skewed Datasets

Precision / recall

Trading off precision and recall

F1 score

Week 4

4.1 Decision Trees

Learning Process

Purity

Choosing a split

One-hot encoding

Continuous variable

4.2 Regression Trees

Regression with Decision Trees

Choosing a split

4.3 Tree ensemble

Sampling with replacement

4.4 Random forest algorithm

Bagged decision tree

Random forest

4.5 XGBoost

Boosted Trees

eXtreme Gradient Boosting

4.6 Decision Trees and Neural Networks

相关文章：