当前位置: 首页 > news >正文

大模型笔记1:大致了解大模型

大模型训练三部曲:

1.预训练:会给大模型输入大量的数据:网页、书籍、代码等,模型通过学习这些数据的语言规律和知识结构,为后续训练打下基础。

2.SFT监督微调阶段:这个阶段工匠般的标注数据被用于对模型进行精细打磨,通过监督学习的方式,让模型能够更好的理解和生成符合人类语言习惯的内容。提升准确性和可靠性。

3.RLHF基于人类反馈的强化学习:人性化的调试,使用的数据集中会带有分数,模型需要尽量给低分内容打低分,高分内容打高分。这么做的目的是让模型不要输出不合法不合规的内容。

大模型的四个特点:

1.规模和参数量大

2.适应能力强,灵活能力强

3.有广泛数据集的预训练

4.计算资源需求大

按照应用场景,大模型可以大致分为:

1.大语言模型LLM

2.多模态模型

大模型的工作流程

1.分词化与词表映射

三种分词化:词粒度、字符粒度、子词粒度

然后会为每个词映射一个token id,也就是建立了词表映射,映射的token id才是最终交给计算机处理的部分。因为计算机或者说模型可没法直接看懂自然语言,它只能看懂数字。

2.文本生成的过程

生成的过程可以拆解为:输入问题、分词化、神经网络计算、概率选择、自回归生成和输出结果。

学到这里我有一个顿悟:大模型给出你想要的内容,其实就是根据你提供的内容,接着你的内容去生成的内容。也就是它的回答不是重新从0生成的,而是接着问题后面生成的,它根本没有把输入的内容看成是一个问题,而是把它看成一个上文,他需要做的是根据上文填写下文。而下文就是你想要的答案。

http://www.dtcms.com/a/249245.html

相关文章:

  • MLLM常见概念通俗解析(五)
  • 【Redis】Redis的启航之路:Ubantu操作系统下安装Redis
  • ABP vNext 多语言与本地化:动态切换、资源继承与热更新
  • 微信小程序使用图片实现红包雨功能
  • error:MISCONF Redis is configured to save RDB snapshots
  • 计算机网络-自顶向下—第五章数据链路层重点复习笔记
  • 《高并发系统性能优化三板斧:缓存 + 异步 + 限流》
  • Nginx+keepalived主从,双主架构
  • git-build-package 工具代码详细解读
  • Git常用命令摘要
  • 青少年编程与数学 01-011 系统软件简介 19 SSMS 数据库管理工具
  • 【AS32系列MCU调试教程】性能优化:Eclipse环境下AS32芯片调试效率提升
  • Java 与 MySQL 性能优化:Linux服务器上MySQL性能指标解读与监控方法
  • Spring MVC 中日期格式转换的两种实用方法
  • ​​实时人脸检测与人脸关键点识别系统实现
  • 简历模板3——数据挖掘工程师5年经验
  • 【机器学习与数据挖掘实战 | 医疗】案例16:基于K-Means聚类的医疗保险的欺诈发现
  • 提的缺陷开发不改,测试该怎么办?
  • shell编程语言-1 shell脚本基础
  • Docker 基础使用
  • 分类预测 | Matlab基于AOA-VMD-LSTM故障诊断分类预测
  • MVVM模式中,BaseViewModel 的 IsBusy 属性的作用
  • 矩阵混剪系统源码搭建全流程技术解析,矩阵OEM
  • LeetCode 第74题:搜索二维矩阵
  • 动态多目标进化算法:基于迁移学习的动态多目标粒子群优化算法(TrMOPSO)求解IEEE CEC 2015,提供完整MATLAB代码
  • MATLAB提供的两种画误差矩阵的函数
  • 【MATLAB例程】追踪法制导的程序,适用于三维平面,目标是运动的,带绘图和捕获时间|附下载链接
  • 经典蓝牙 vs BLE:10 大核心差异深度对比(附高频考点 + 大厂真题)
  • 基于docker技术的单主机环境模拟测试批量客户端
  • 软件测试质量的“防”与“治”