当前位置：首页 > news >正文

【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)

news 来源：原创 2025/5/7 12:44:15

前序文章
【AI系列】从零开始学习大模型GPT (1)- Build a Large Language Model (From Scratch)

Build a Large Language Model

- 背景
- 第1章：理解大型语言模型
- 第2章：处理文本数据
- 第3章：编码Attention机制
- - 什么是Attention机制？
  - - Attention机制的基本原理
    - 数学表示
    - 应用
    - 总结
  - 为什么要使用注意力机制
  - 如何实现？
  - - 简单注意力机制
    - 带训练权重的注意力机制
    - 紧凑注意力机制 mask attention
    - 多头注意力机制
- 第4章：从零实现GPT模型
- 第5章：在未标记数据上进行预训练
- 第6章：用于文本分类的微调
- 第7章：为指令执行进行微调
- 参考

背景

第1章：理解大型语言模型

见前序文章【AI系列】从零开始学习大模型GPT (1)- Build a Large Language Model (From Scratch)

第2章：处理文本数据

见前序文章【AI系列】从零开始学习大模型GPT (1)- Build a Large Language Model (From Scratch)

第3章：编码Attention机制

什么是Attention机制？

Attention机制是一种在深度学习中广泛应用的技术，特别是在自然语言处理（NLP）和计算机视觉等领域。它的核心思想是让模型在处理输入数据时，能够有选择地关注某些重要部分，而不是对所有部分一视同仁。这种机制可以显著提高模型的性能和效率。

Attention机制的基本原理

Attention机制的基本原理可以通过以下几个步骤来描述：

计算注意力权重（Attention Weights）：
对于每一个输入元素，计算它与其他输入元素的相关性（即注意力权重）。这些权重通常通过点积（dot product）或其他相似度度量方法来计算。
归一化权重：
使用Softmax函数将这些权重归一化，使它们的和为1。这一步确保了权重可以被解释为概率分布。
加权求和：
使用归一化后的权重对输入元素进行加权求和，得到一个新的表示。这一步的结果是模型能够更关注那些权重较高的输入元素。

数学表示

假设有一个输入序列 $[x_1, x_2, \ldots, x_n]$ ，Attention机制的计算过程可以表示为：

计算注意力权重：
$e_{ij} = \text{score}(x_i, x_j)$
其中， $\text{score}(x_i, x_j)$ 可以是点积、加性函数等。
归一化权重：
$\alpha_{ij} = \frac{\exp(e_{ij})}{\sum_{k=1}^{n} \exp(e_{ik})}$

相关文章：

C# ASP.NET的未来发展趋势

ElasticSearch基础和使用

SOUI基于Zint生成Code 2 of 5码

（5/100）每日小游戏平台系列

Vue3（1）

探索顶级汽车软件解决方案：驱动行业变革的关键力量

Create Deploy Your Website Quickly - Docusaurus GitHub Pages

2.14学习记录

28、深度学习-自学之路-NLP自然语言处理-做一个完形填空，让机器学习更多的内容程序展示

DeepSeek 引领AI新潮流：Janus-Pro 打破多模态理解与生成的边界

探索Hugging Face：开源AI社区的核心工具与应用实践

【Xposed】在 Android Studio 中使用 Kotlin DSL 自动结束并启动应用进程

Zabbix告警队列清理教程

JUC并发—Java集合包底层源码剖析

麒麟系统离线安装SVN

【Elasticsearch】Elasticsearch检索方式全解析：从基础到实战（一）

[css] 黑白主题切换

poetry shell - 作为插件安装和使用

Django开发入门 – 5. Web框架与MVT架构

手写数字识别学习记录（自用）

金融监管总局将推出8项增量政策：涉房地产金融、险资入市、稳外贸等

新闻分析：电影关税能“让好莱坞再次伟大”？

跳水世界杯总决赛陈佳获得女子3米板冠军，陈艺文获得亚军

美国加州州长：加州继续对中国“敞开贸易大门”

神十九都带回了哪些实验样品？果蝇等生命类样品已交付科学家

【社论】法治是对民营经济最好的促进