当前位置：首页 > news >正文

大模型笔记1：大致了解大模型

news 2025/9/1 11:11:15

大模型训练三部曲：

1.预训练：会给大模型输入大量的数据：网页、书籍、代码等，模型通过学习这些数据的语言规律和知识结构，为后续训练打下基础。

2.SFT监督微调阶段：这个阶段工匠般的标注数据被用于对模型进行精细打磨，通过监督学习的方式，让模型能够更好的理解和生成符合人类语言习惯的内容。提升准确性和可靠性。

3.RLHF基于人类反馈的强化学习：人性化的调试，使用的数据集中会带有分数，模型需要尽量给低分内容打低分，高分内容打高分。这么做的目的是让模型不要输出不合法不合规的内容。

大模型的四个特点：

1.规模和参数量大

2.适应能力强，灵活能力强

3.有广泛数据集的预训练

4.计算资源需求大

按照应用场景，大模型可以大致分为：

1.大语言模型LLM

2.多模态模型

大模型的工作流程

1.分词化与词表映射

三种分词化：词粒度、字符粒度、子词粒度

然后会为每个词映射一个token id，也就是建立了词表映射，映射的token id才是最终交给计算机处理的部分。因为计算机或者说模型可没法直接看懂自然语言，它只能看懂数字。

2.文本生成的过程

生成的过程可以拆解为：输入问题、分词化、神经网络计算、概率选择、自回归生成和输出结果。

学到这里我有一个顿悟：大模型给出你想要的内容，其实就是根据你提供的内容，接着你的内容去生成的内容。也就是它的回答不是重新从0生成的，而是接着问题后面生成的，它根本没有把输入的内容看成是一个问题，而是把它看成一个上文，他需要做的是根据上文填写下文。而下文就是你想要的答案。

查看全文

http://www.dtcms.com/a/249245.html

MLLM常见概念通俗解析（五）

【Redis】Redis的启航之路：Ubantu操作系统下安装Redis

ABP vNext 多语言与本地化：动态切换、资源继承与热更新

微信小程序使用图片实现红包雨功能

error:MISCONF Redis is configured to save RDB snapshots

计算机网络-自顶向下—第五章数据链路层重点复习笔记

《高并发系统性能优化三板斧：缓存 + 异步 + 限流》

Nginx+keepalived主从，双主架构

git-build-package 工具代码详细解读

Git常用命令摘要

青少年编程与数学 01-011 系统软件简介 19 SSMS 数据库管理工具

【AS32系列MCU调试教程】性能优化：Eclipse环境下AS32芯片调试效率提升

Java 与 MySQL 性能优化：Linux服务器上MySQL性能指标解读与监控方法

Spring MVC 中日期格式转换的两种实用方法

实时人脸检测与人脸关键点识别系统实现

简历模板3——数据挖掘工程师5年经验

【机器学习与数据挖掘实战 | 医疗】案例16：基于K-Means聚类的医疗保险的欺诈发现

提的缺陷开发不改，测试该怎么办？

shell编程语言-1 shell脚本基础

Docker 基础使用

分类预测 | Matlab基于AOA-VMD-LSTM故障诊断分类预测

MVVM模式中，BaseViewModel 的 IsBusy 属性的作用

矩阵混剪系统源码搭建全流程技术解析，矩阵OEM

LeetCode 第74题：搜索二维矩阵

动态多目标进化算法：基于迁移学习的动态多目标粒子群优化算法（TrMOPSO）求解IEEE CEC 2015，提供完整MATLAB代码

MATLAB提供的两种画误差矩阵的函数

【MATLAB例程】追踪法制导的程序，适用于三维平面，目标是运动的，带绘图和捕获时间|附下载链接

经典蓝牙 vs BLE：10 大核心差异深度对比（附高频考点 + 大厂真题）

基于docker技术的单主机环境模拟测试批量客户端

软件测试质量的“防”与“治”

大模型训练三部曲：

大模型的四个特点：

按照应用场景，大模型可以大致分为：

大模型的工作流程

相关文章：