当前位置: 首页 > news >正文

大模型微调与部署课程笔记

文章目录

    • 一、指令数据准备与构建
      • 1)深度学习中的数据工程
      • 2)prompt-engineering与指令数据
        • (1) prompt-engineering概念(提示词工程)
        • (2)指令数据
      • 3)构建微调指令数据
      • 4)开源指令数据集
      • 5)project1:大模型文本摘要微调时间 part1和part2
    • 二、指令数据进阶与增强
      • 1)指令数据重要性
      • 2)数据好坏的度量
      • 3)指令数据的筛选与配比
      • 4)指令数据的扩充
      • 5)指令数据优化案例
      • 6)数学推理指令与思维链
    • 三、大模型微调理论
      • 1)指令微调基础概述
      • 2)指令微调的基本流程和分类
      • 3)指令微调方法:全量参数微调
      • 4)指令微调方法:高效指令微调
      • 5)大模型微调理论小结
      • 6)project1 大模型文本摘要微调实践 part3
    • 四、微调后的模型评估
      • 1)语言模型通用能力评估
      • 2)语言模型专项能力评估-以课程项目为例子
      • 3)bad case 定位、问题分析及解决办法
      • 4)project1 大模型文本摘要微调时间part4
      • 5)project2 大模型工具调用技术实践
    • 五、模型部署理论
      • 1)大模型高效部署
      • 2)主流框架部署介绍
      • 3)Text Generation inference 详解
      • 4)TGI整体推理流程
    • 六、模型部署实践
      • 1)前期准备
      • 2)模型部署
      • 3)服务访问
      • 4)模型服务基准测试
    • 七、课程总结与未来发展
      • 1)本章概述
      • 2)总结:模型与指令数据
      • 3)总结:模型训练与优化
      • 4)总结:推理优化
      • 5)大模型微调与RAG技术
      • 6)技术发展展望

一、指令数据准备与构建

  • 指令微调的方法(一般先做指令微调,后做强化学习)
    1)指令微调
    2)强化学习反馈(需要reward model)
    在这里插入图片描述

1)深度学习中的数据工程

  • 数据工程主要任务
    在这里插入图片描述
  • 数据处理
    在这里插入图片描述
    变成
    在这里插入图片描述

2)prompt-engineering与指令数据

(1) prompt-engineering概念(提示词工程)

在这里插入图片描述
①提示词样本示例
在这里插入图片描述
②输入提示效果类型:zero-shot预训练的时候内容反应
在这里插入图片描述
③思维链提示
在这里插入图片描述

(2)指令数据

在这里插入图片描述

  • 指令微调好处
    在这里插入图片描述

3)构建微调指令数据

4)开源指令数据集

5)project1:大模型文本摘要微调时间 part1和part2

二、指令数据进阶与增强

1)指令数据重要性

2)数据好坏的度量

3)指令数据的筛选与配比

4)指令数据的扩充

5)指令数据优化案例

6)数学推理指令与思维链

三、大模型微调理论

1)指令微调基础概述

2)指令微调的基本流程和分类

3)指令微调方法:全量参数微调

4)指令微调方法:高效指令微调

5)大模型微调理论小结

6)project1 大模型文本摘要微调实践 part3

四、微调后的模型评估

1)语言模型通用能力评估

2)语言模型专项能力评估-以课程项目为例子

3)bad case 定位、问题分析及解决办法

4)project1 大模型文本摘要微调时间part4

5)project2 大模型工具调用技术实践

五、模型部署理论

1)大模型高效部署

2)主流框架部署介绍

3)Text Generation inference 详解

4)TGI整体推理流程

六、模型部署实践

1)前期准备

2)模型部署

3)服务访问

4)模型服务基准测试

七、课程总结与未来发展

1)本章概述

2)总结:模型与指令数据

3)总结:模型训练与优化

4)总结:推理优化

5)大模型微调与RAG技术

6)技术发展展望

http://www.dtcms.com/a/310596.html

相关文章:

  • FreeRTOS硬件中断发生时的现场
  • Spring AI 与 LangChain4j 对比及入门案例解析
  • Selenium:强大的 Web 自动化测试工具
  • VS Code中配置使用slint(Rust)的一个小例子
  • 亚马逊广告:如何借助AI玩转长尾词提升ROI
  • 伞状Meta分析重构癌症幸存者照护指南:从矛盾证据到精准决策
  • (28)运动目标检测之随机曲线上的离散点进行插值
  • 金智维董事长廖万里出席2025中国科创投资夏季峰会,共话智能体垂直落地新路径
  • deepseek: 批量处理脚本
  • shell脚本的语法使用及例题
  • Vue.js的核心概念
  • LVDS系列23:Xilinx Ultrascale系ISERDESE3原语(一)
  • 系统开机时自动执行指令
  • Java:JWT 从原理到高频面试题解析
  • 04 基于sklearn的机械学习-梯度下降(上)
  • 什么样的业务需要国内动态IP轮换?
  • 第二篇:Linux 文件系统操作:从基础到进阶
  • RAL-2025 | “藏宝图”驱动的具身导航!HAM-Nav:基于手绘地图引导的机器人导航
  • GitPython08-源码解读
  • 进阶08:C#与SQL Server通信
  • 高效连接,3针M12航空插头助您畅行无阻
  • PSA 制氧装置和VPSA 制氧装置技术特点有什么不同
  • [VL|RIS] ReferSAM
  • windows电脑开机或重启,server不能自启动
  • 关税战火中的技术方舟:新西兰证券交易所的破局之道 ——从15%关税冲击到跨塔斯曼结算联盟,解码下一代交易基础设施
  • 开发后台管理系统的注意事项
  • 26考研|数学分析:曲线(面)积分·三大公式
  • Windows系统优化命令-记录
  • 全国增值税发票查验流程-批量核验-接口集成简便高效
  • 四、基于SpringBoot,MVC后端开发笔记