【大模型】-名词手册-扫盲
写在前面
本篇文章用来记录在了解学习大模型的过程中遇到的一些名词缩写,好记性不如烂笔头,记录下来,也供大家参考。如有不正确的,欢迎指正。
目录
- 写在前面
- 名词扫盲
- 写在后面
名词扫盲
缩写 | 英文全程 | 中文 | 备注 |
---|---|---|---|
- | - | - | - |
AIGC | Artificial Intelligence Generated Content | 人工智能生成内容 | |
AI Hallucinations | AI幻觉 | ||
BERT | Bidirectional Encoder Representation from Transformers | 双向编码器表示 | 在2018年提出的一种预训练语言表示的方法 |
CPU | Central Processing Unit | 中央处理器 | 处理器 |
CNN | Convolutional Neural Network | 卷积神经网络 | |
COT | Chain Of Thought | 链式思维 | |
DPU | Deep learning Processing Unit | 深度学习处理器 | 处理器 |
FFN | Feed-Forward Neural Network | 前馈神经网络 | |
GPU | Graphics Processing Unit | 图形处理器 | 处理器 |
GPT | Generative Pre-trained Transformer | 生成式预训练变换器 | |
GQA | Grouped-Query Attention | 分组查询注意力 | |
LoRA | Low-Rank Adaptation of Large Language Models | 大语言模型的低阶自适应 | |
LLM | Large Language Model | 大语言模型 | |
MTP | Multi-Token Prediction | 多Token预测技术 | |
MLA | Multi-Head Latent Attention | 多头潜在注意力 | 架构 |
MQA | Multi-Query Attention | 多查询注意力 | |
MoE | Mixture of Experts | 混合专家模型 | 架构 |
NLP | Natural Language Processing | 自然语言处理 | |
NPU | Neural network Processing Unit | 神经网络处理器 | 处理器 |
Prompt | 提示词 | ||
RLHF | Reinforcement Learning from Human Feedback | 基于人类反馈对语言模型进行强化学习 | |
RL | Reinforcement Learning | 强化学习 | |
RWKV | Recurrent Weighted Key Value | 基于RNN的加权键值 | |
RNN | Recurrent Neural Network | 循环神经网络 | |
RAG | Retrieval-Augmented Generation | 检索增强生成 | |
SFT | Supervised Fine-Tuning | 监督微调 | |
SA | Self-Attention | 自注意力机制 | |
Tokenizer | 分词器 | ||
Transformer | 变换器 | 架构 | |
TPU | Tensor Processing Unit | 张量处理器 | 处理器 |
- | - | - | - |
写在后面
如果本文内容对您有价值或者有启发的话,欢迎点赞、关注、评论和转发。您的反馈和陪伴将促进我们共同进步和成长。