当前位置：首页 > news >正文

深度学习基础：从原理到实践——第一章感知机（中）

news 2025/10/8 6:16:44

1.3感知机的数学模型

1.3.1感知机的数学定义

图4感知机模型

感知机的数学模型可以形式化地定义为：给定输入空间（特征空间）X ⊆ Rⁿ，输出空间 Y = {0, 1}。感知机是定义在特征空间上的如下函数：

f(x) = sign(w·x + b)

其中，w ∈ Rⁿ是权重向量，b ∈ R 是偏置，w・x 表示向量 w 和 x 的点积运算，sign (・) 是符号函数，定义为：

sign(z) = { 1, z ≥ 0; 0, z < 0 }

权重向量 w 和偏置 b 统称为感知机的模型参数。权重向量 w 决定了输入特征的重要性，偏置 b 则控制了分类边界的位置。从几何意义上看，w・x + b = 0 定义了特征空间中的一个超平面，称为分离超平面。

1.3.2权重和偏置的几何意义

在感知机模型中，权重向量 w 和偏置 b 具有明确的几何意义。权重向量 w 是分类超平面的法向量，它决定了超平面的方向。偏置 b 则决定了超平面距离原点的远近。

具体来说，对于超平面 w・x + b = 0，任意一点 x 到超平面的距离可以用公式表示为：

d = |w·x + b| / ||w||

其中 ||w|| 表示权重向量 w 的 L2 范数。这个距离公式揭示了感知机的分类机制：样本点到超平面的距离决定了分类的置信度。距离越大，分类的确定性越高；距离越小，分类的不确定性越大。

权重向量 w 的方向还决定了特征空间中不同方向上的重要性。权重的绝对值越大，对应的特征对分类结果的影响就越大。例如，如果 w₁的绝对值远大于其他权重分量，说明第一个特征在分类中起着主导作用。偏置 b 的作用类似于截距，它调整了超平面在特征空间中的位置，使得分类边界可以在空间中自由移动，而不改变其方向。

图 5感知机是一个线性分类器

1.3.3激活函数的选择与作用

感知机使用符号函数 sign (・) 作为激活函数，这是一个阶跃函数，在零点处不连续。激活函数的作用是将线性组合的结果转换为离散的分类标签。除了符号函数，感知机也可以使用其他激活函数，如 sigmoid 函数、tanh 函数等，但这些激活函数主要用于多层感知机中。

常用激活函数如下：

1）阶跃函数

激活函数以阈值为界，一旦输入超过阈值，就切换输出。这样的函数称为“阶跃函数”。

图 6阶跃函数公式及图形

2）sigmoid 函数

神经网络中经常使用的一个激活函数是sigmoid 函数：

图 7 sigmoid 函数公式及图形

3）ReLU 函数

在神经网络发展的历史上， sigmoid 函数很早就开始被使用了，而最近则主要使用 ReLU 线性整流函数 ( Rectified Linear Unit )函数。

图 8 ReLU 函数公式及图形

4）tanh 函数

图 9 tanh 函数公式及图形

激活函数的选择对感知机的性能有重要影响。符号函数的优点是计算简单，输出明确，但它的不连续性导致无法使用梯度下降等基于导数的优化算法。这也是为什么感知机需要使用专门的学习算法，而不能直接应用通用的梯度下降方法。

在实际应用中，有时会使用平滑的激活函数来近似符号函数，如使用 sigmoid 函数的阈值输出。但这种做法改变了感知机的本质特性，使其不再是严格意义上的线性分类器。因此，在单层感知机中，符号函数仍然是最标准的选择。

http://www.dtcms.com/a/453261.html

相关文章：

企业网站策划怎么样揭阳模板网站建站

计算机网络第四章(8)——网络层《ICMB网际控制协议》

网络教育网站如何做营销推广做ppt必备网站

移植到Linux，Avalonia初次尝试意外美好

asp网站管理系统源码免费申请163邮箱

欧拉公式剖析

冲刺校招打卡 day02

【精品资料鉴赏】312页WORD 详解发电企业数字化转型规划方案（）

进阶 C++ 学习总结与核心感悟

gRPC从0到1系列【24】

无锡设计师网站又拍云wordpress全站cdn

LeetCode 刷题【106. 从中序与后序遍历序列构造二叉树】

大模型的核心原理

用友u8 erp和免费生产排程软件isuperaps通过sql实现数据集成示例

车载诊断架构 --- 车载ECU故障类型详解（下）

解读IEC 60502-2 2014

引流网站建设c 转网站开发

新建网站如何做关键词wordpress一句话插件

通过git拉取前端项目

建设诚信网站儒枫网网站建设

AI - 自然语言处理(NLP) - part 3 - 语言模型

人工智能与数据领域700+职位数据集：支持就业市场分析、NLP训练与推荐系统开发的高质量研究资源

律师手机网站模板北京市工程建设交易信息网站

0基础学CV(4)|目标检测模型之yolov8训练自己的数据集

网站产品模块青岛做网站哪家公司好

rule 5 permit source 192.168.1.0 0.0.0.127 特定子网概念及实验

网站建设重庆三合一网站建设推广

- custom_action_cpp: 自定义动作创建与调用示例

如何修改iptables+wg实现双层网络转发到工业现场设备

《投资-78》价值投资者的认知升级与交易规则重构 - 架构