当前位置：首页 > news >正文

第1节从函数到神经网络：AI思路的逆袭之路

news 2025/8/15 8:30:15

🤔 开篇灵魂拷问

是不是觉得AI知识体系庞大到吓人？看了一堆快餐视频还是云里雾里？别慌！这个系列就是要帮你打通任督二脉，用"既快又慢、既深入又肤浅、既有趣又严肃"的方式讲透AI基础知识！

💡 核心信念：万物皆函数

记住！整个AI的出发点就一句话：世界上所有逻辑和知识都能用函数（function）表示。把现实抽象成符号，设置运算规则（函数），算出来结果再反推现实——听着是不是特有道理？

事实上函数就是一种变换，对数据进行变换得到我们所需要的结果。

🔍 早期AI的"理想主义"：符号主义

早期的人工智能->符号主义，即用精确的函数来表示一切。

直角三角形求斜边用勾股定理（a²+b²=c²），物体受力用F=ma——这些明确规则的函数玩得转，但遇到图片识别猫狗这种人类觉得简单到爆炸的问题，直接变成史诗级难题！连语法明确的语言翻译都做不到丝滑，更别说复杂的人类智能了...只能说，早期AI还是太年轻，把世界想得太简单！

摆烂式创新：联结主义登场

找不到精确函数咋办？人类终于承认自己"太菜了"，发明了猜+简化的骚操作！比如给一堆X和Y的数据，先瞎猜个函数（比如Y=X），然后慢慢调参数（W和B）让它贴近真实数据，就算不能完全吻合，差不多就行！这就是现代AI的核心思路——联结主义！

但是很多时候，我们没办法找到一个精确的函数来描述某个关系，（图中计算机很难识别）

退而求其次选择一个近似解也不错，也就是说函数没必要精确的通过每一个点，它只需要最接近结果就好了，这就是联结主义。

🚀 连接主义的逆袭

你还别不信！就靠这种"连蒙带猜"的方法，用很少参数就能实现手写数字识别，直接打脸当初看不起它的专家！事实证明：结果说话才是硬道理！

虽然“连蒙带猜”听起来不靠谱，但实战效果惊人：用很少的参数就能实现手写数字识别等任务，证明了有效性后才被重视。

当数据稍微变化一下，出现曲线的时候，简单的线性函数就没办法解决这个问题了。那我们的目标就是将线性函数转为非线性函数，这可以通过套一个非线性函数来做到，比如平方、正弦函数、指数函数。

这就是激活函数。激活函数把原来的线性关系转变成非线性的关系。

激活函数：给直线“掰弯”的魔法

线性函数（y=wx+b）太死板，遇到非线性数据就不行。于是给线性变换套个非线性激活函数（如平方、sin、e^x），让曲线“弯得更灵活”。

🧠 神经网络进化论

线性函数不够用？给它套个非线性"马甲"！比如加个平方、sin函数——这就是激活函数，瞬间让函数从"死板直线"变身"灵活曲线"！

一层不够就叠罗汉！线性变换+激活函数反复套娃，中间藏起来的"黑箱子"叫隐藏层，输入层→隐藏层→输出层的信号传播就是前向传播。理论上，这玩意儿能逼近任意复杂的连续函数！

这还不够，正常情况下我们不会只有一个输入，并且只有一个激活函数可能不会达到理想的结果，所以开始嵌套！

像这样多个输入，激活函数外面加一次线性变换，再套一个激活函数，并且还可以不断嵌套。通过这样的方式，我们可以构造出非常复杂的关系，理论上可以逼近任意的连续函数。

但这样看起来太复杂了，所以我们引入神经元的概念，

神经网络：函数套娃的可视化

把“线性变换+激活函数”画成神经元（小圈圈），输入层→隐藏层→输出层，每层都是一次函数变换。
隐藏层：中间层不直接输出，相当于“套在函数里的函数”，让模型能表达更复杂关系。
前向传播：信号从输入层到输出层的计算过程，本质就是分步算一个超复杂函数的值。

图中的一个小圈就是一个神经元，多个神经元互相连接形成的网状结构就叫做神经网络。同时我们可以看到随着函数式子的嵌套，神经网络也在拓展，原本的输出成为了隐藏层：位于输入层和输出层之间的中间层。隐藏层的主要作用是对输入数据进行复杂的特征提取和变换，

核心洞察：神经网络理论上可以逼近任意连续函数，而整个AI的后续知识，本质上都是为了算出这些神经元之间的w（权重）和b（偏置）！

🎯 终极目标：猜中W和B

不管神经网络多花里胡哨，本质都是为了猜出所有参数（W权重和B偏置）！从简单的直线方程到上万神经元的深度网络，AI工程师每天都在跟这些参数死磕...至于怎么磕？卖个关子，且听下回分解！

从神经网络的图示来看，就像是一个信号从左向右传播的过程，这个过程就叫做神经网络的前向传播。并且神经网络的层数和每一层的神经元都可以叠加，这样就可以构成一个非常复杂的非线性函数。看起来复杂，但是我们的目标还是一开始说的：找到一个近似解，也就是根据已知的x、y猜出所有的w和b。

一小时从函数到Transformer！一路大白话彻底理解AI原理_哔哩哔哩_bilibili

查看全文

http://www.dtcms.com/a/331310.html

Mybatis学习笔记(八)

VS2022 C++生成和调用DLL动态链接库

小杰python高级（six day）——pandas库

自由学习记录（84）

nnDetection在windows系统下使用教程

4.Ansible部署文件到主机

Torch -- 卷积学习day2 -- 卷积扩展、数据集、模型

Linux软件编程(四)多任务与多进程管理

机械硬盘模块逻辑与工作原理

某处卖600的【独角仙】尾盘十分钟短线尾盘短线思路手机电脑通用无未来函数

uniapp对接极光消息推送

【CLR via C#（第3版）阅读笔记】类型基础

[特殊字符]走进华为，解锁商业传奇密码

K8s学习----Namespace：资源隔离与环境管理的核心机制

渲染 opentype 多个字符的文本，并设置文本的渲染开始位置

Warm-Flow 1.8.0 重大更新

Lua 脚本在 Redis 中的应用

vivo Pulsar 万亿级消息处理实践（4）-Ansible运维部署

河南萌新联赛2025第（五）场：信息工程大学补题

飞书文档定时自动同步至百炼知识库

ESP32 I2S音频总线学习笔记（六）：DIY蓝牙音箱教程

CVPR 2025 | 北大团队SLAM3R：单目RGB长视频实时重建，精度效率双杀！

在mysql＞下怎么运行 .sql脚本

C#WPF实战出真汁00--项目介绍

极速开发新体验_Vite构建工具详解

使用YOLOv13进行钢板表面缺陷检测

Python之Django使用技巧（附视频教程）

云手机都具有哪些特点？

Ollama如何分别使用2张H100GPU和4张A100部署GPT-OSS-120B全指南：硬件配置与负载均衡实战

Linux命令大全-zip命令