当前位置: 首页 > news >正文

【LLM】浙大: 大模型基础 第一版 第一章:语言模型基础

Foundations-of-LLMs

  • 大模型基础
    本书旨在为对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真听取开源社区以及广大专家学者的建议,持续进行月度更新,致力打造易读、严谨、有深度的大模型教材。并且,本书还将针对每章内容配备相关的Paper List,以跟踪相关技术的最新进展。

本书第一版包括传统语言模型、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六章内容。为增加本书的易读性,每章分别以一种动物为背景,对具体技术进行举例说明,故此本书以六种动物作为封面。当前版本所含内容均来源于作者团队对相关方向的探索与理解,如有谬误,恳请大家多提issue,多多赐教。后续,作者团队还将继续探索大模型推理加速、大模型智能体等方向。相关内容也将陆续补充到本书的后续版本中,期待封面上的动物越来越多。

当前完整的本书PDF版本路径为大模型基础.pdf。另外,我们还提供了两个文件夹,大语言模型分章节内容文件夹中包含了各章节的PDF版本。而大语言模型相关论文文件夹中包含了各章节的相关论文,当前正处于不断更新中。

其中每个章节的内容目录如下表所示。

PDF处理<

相关文章:

  • CMake configure_file
  • Mycat中间件
  • 实现能源高效利用、优化能源结构、降低碳排放的智慧能源开源了
  • COBOL语言的移动应用开发
  • 第1章大型互联网公司的基础架构——1.3 HTTP-DNS
  • ### net7 + 出现了 自带的 限流中间件 固定窗口、滑动窗口 并发 令牌桶 全局限流器
  • deepseek本地部署方案(超简单)
  • 网页制作02-html,css,javascript初认识のhtml的文字与段落标记
  • Audio-Visual Speech Enhancement(视听语音增强)领域近三年研究进展与国内团队及手机厂商动态分析
  • js闭包,跨域
  • Effective C++读书笔记——item49(了解new-handle的行为)
  • 深度学习:从技术突破到未来展望
  • Linux系统 -- 环境安装,xshell和多用户,基本的Linux指令和Linux的用处
  • OpenCV中的边缘检测
  • 从低清到4K的魔法:FlashVideo突破高分辨率视频生成计算瓶颈(港大港中文字节)
  • Tomcat如何处理Http请求
  • 白话概念模型、逻辑模型与物理模型
  • ubuntu 安装 Redis
  • Java和JavaScript当中的json对象和json字符串分别讲解
  • Weather Regimes(WRs)方法介绍
  • “五一”逃离城市计划:带上帐篷去大自然里充电
  • 上海国际咖啡文化节开幕,北外滩集结了超350个展位
  • 李开复出任福耀科技大学理事会理事,助力学校AI战略
  • 中国建设银行浙江省分行原党委书记、行长高强接受审查调查
  • 昂立教育:去年减亏1.39亿元,今年以“利润持续增长”为核心目标
  • 国务院安委会对辽宁辽阳一饭店重大火灾事故查处挂牌督办