当前位置: 首页 > news >正文

李宏毅2025《机器学习》第三讲-AI的脑科学

在之前的课程中探讨了如何利用大模型构建AI Agent,本科将暂时放下应用层面的探索,拿起“手术刀”和“显微镜”,深入剖析LLM的“大脑”,带您踏上一场“AI脑神经科学”的旅程。课程不讨论模型的训练过程,而是假设我们拥有一个已经训练好的、功能完备的LLM。我们的目标是:理解这个庞大而复杂的神经网络,在面对输入并生成输出的每一个瞬间,其内部究竟发生了什么。

重要提醒: 正如李宏毅老师在课程开始时强调的,目前绝大多数的这类分析研究,受限于计算资源,往往是在相对较小或较早期的开源模型(如GPT-2、LLaMA系列早期版本)上进行的。这就像是通过研究老鼠的大脑来推断人类大脑的运作机制。虽然基本原理可能相通,但我们必须认识到,这些结论不一定完全适用于最新、最顶尖的闭源模型。然而,这些开创性的研究为我们提供了一套宝贵的分析方法论和深刻的洞见。

本次探索将分为四个部分:

  1. 单个神经元在做什么?——从最基础的单元开始。
  2. 一层神经元在做什么?——从个体到群体的协作模式。
  3. 跨层神经元如何互动?——追踪信息在网络中的完整流动路径。
  4. 让模型亲口说出想法——利用LLM的语言能力进行自我剖析。

第一部分:一个神经元的使命——“川普神经元”与分布式表达的现实

要理解一个神经元,我们首先要明确它在Transformer中的位置。在Transformer的每个层块(Layer)中,除了自注意力(Self-Attention)机制外,还有一个重要的部分叫做前馈网络(Feed-Forward Network, FFN)。这个FFN通常由两个线性层和一个非线性激活函数(如ReLU)组成。当我们说“一个神经元”时,通常指的就是FFN中第一个线性层之后、激活函数之前或之后的一个节点。它的输出,是其输入向量的加权和,再通过激活函数(例如ReLU,将负值归零)处理后的结果。一个神经元的“激活”,通常意味着它的输出值大于零。

那么,我们如何探究一个神经元的功能呢?通常遵循一个三步流程:

  1. 观察(相关性):找到能最大化激活该神经元的输入文本。例如,我们发现当某个神经元被高度激活时,模型倾向于生成脏话。这说明该神经元与“说脏话”这一行为相关
  2. 干预(因果性):为了验证因果关系,我们需要进行实验。最直接的方法是“敲除”(Ablation)这个神经元,即强制将其输出设为零(或其在大量数据上的平均激活值)。如果敲除后,模型在各种挑衅下都无法生成脏话,我们就能更确信这个神经元对“说脏话”有因果作用。
  3. 控制(剂量效应):如果可能,尝试不同程度地激活该神经元,观察其输出的变化。比如,轻微激活时说轻度脏话,强烈激活时则言辞激烈。

历史上最著名的例子莫过

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.dtcms.com/a/256204.html

相关文章:

  • “荔枝使”的难题怎么破:A*运输路径算法编程实践
  • Nginx+tomcat集群
  • AI Gateway 介绍
  • 【Node】最佳Node.js后端开发模板推荐
  • 分组交换比报文交换的传输时延更低
  • AWS-SAA 第二部份:安全性和权限管理
  • Docker学习笔记:DockerFile
  • 服务发现与动态负载均衡的结合
  • Typora文档另存与图片迁移的一种思路
  • nginx代理与tomcat动静分离
  • app专项测试命令如何写?
  • Zephyr 电源管理机制深度解析:从 Tickless Idle 到平台 Suspend 实践
  • C++11的一些特性
  • JavaEE:使用JMeter进行接口并发测试
  • docker执行yum报错Could not resolve host: mirrorlist.centos.org
  • 旧物回收小程序开发:开启绿色生活新方式
  • 使用Vue3开发Electorn桌面应用
  • 车载电子电器架构 --- 电子电气架构设计方案
  • 容器通信技术与数据持久化
  • Solidity内部合约创建全解析:解锁Web3开发新姿势
  • 4.1 FFmpeg编译选项配置
  • 基于Attention机制的模型。这使得它摆脱了RNN模型顺序读取序列的缺点,可以实现高度的并行化的理解
  • 《Effective Python》第九章 并发与并行——使用 concurrent.futures 实现真正的并行化
  • HarmonyOS 5的分布式通信矩阵是如何工作的?
  • Docker 高级管理笔记
  • HTML5简介
  • 高云GW5AT-LV60 FPGA图像处理板
  • 升级到 .NET 9 分步指南
  • redis分布式锁 Redisson在电商平台开发中的实际应用
  • sqlsuger 获取表行数