大模型入门学习路径(个人学习路径的分享)
一,基础学习
1,数学基础
线性代数:MIT的线性代数公开课,丘维声高等代数
微积分
概率论与数理统计
2,编程基础
python:编程语言,掌握基本语法、数据类型、控制流等,熟悉常用库如 NumPy、Pandas 等
数据结构:常用数据结构(数组、链表、树、图)和算法(排序、搜索、动态规划)(可以先了解,不用深入)
3,机器学习基础
周志华《机器学习》
吴恩达《吴恩达机器学习》(这门课好像在在youtube上,无法登录youtube的学习者,B站上有人搬运过来了,也可以学习)
二,深入学习
1,深度学习理论
邱锡鹏《深度学习》(B站视频)
《深度学习》 - Ian Goodfellow, Yoshua Bengio, Aaron Courville
李宏毅深度学习详解:GitHub - datawhalechina/leedl-tutorial: 《李宏毅深度学习教程》(李宏毅老师推荐👍,苹果书🍎),PDF下载地址:https://github.com/datawhalechina/leedl-tutorial/releases
2,机器学习框架
PyTorch(推荐):B站小土堆视频,刘二大人,炮哥带你学pytorch
TensorFlow
三,探索基本大模型
1,Transformer架构
理解Transformer架构的基本原理,这是大模型(如GPT-3、BERT等)的基础。(B站很多讲解的,可以参考,时间都很短)。
2,基本大模型概念
GitHub - datawhalechina/llm-cookbook: 面向开发者的 LLM 入门教程,吴恩达大模型系列课程中文版
GitHub - datawhalechina/hugging-llm: HuggingLLM, Hugging Future.
四,项目实战
1,零基础入门NLP - 新闻文本分类:team-learning-nlp/NewsTextClassification at master · datawhalechina/team-learning-nlp · GitHub
2,动手学大模型应用开发
3,happy-LLm:GitHub - datawhalechina/happy-llm: 📚 从零开始的大语言模型原理与实践教程
写在最后
我个人是通过datawhale这个开源的组织社区去入门的大模型,上述推荐的很多也是来自这个社区,也是我认为比较好的一个开源社区,没有恰饭,单纯推荐!如果有任何侵权的地方,请联系我,会及时删除并道歉。
