大模型实习
(信息从互联网上收集)
快手
10点半到岗,12点午休,2点上班,晚上到9点。8点打卡才有30餐补
福利:220中秋礼盒,麻将,月饼。周边
找实习的经验
0论文0实习,6月底准备,9月初投递,9月底拿到offer
-
前期准备:
一、找方向:预训练、微调、rag、强化学习、agent。没方向都了解一下
二、学习途径:CSDN,modelscope,b站up(happy魇、RethinkFun),苏剑林|BoJone,科学空间博主
三、整理知识库
四、论文 Deepseek:MOE、GRPO完全搞懂
五、快面试的时候可以小红书、牛客看面经
六、多和大模型交流
七、项目 github跑一下优化一下、论文项目
八、代码 力扣hot100,至少留一个月,刷两遍
九、手撕代码 如多头注意力
十、官网投递和身边靠谱资源 -
面试过程中的感受:
一、被挂很正常,没有hire count或方向不匹配
二、引导面试官到你熟悉的内容
三、每面完一场就差缺补漏
入门大模型
总体思路就是直接nlp转大模型,ml不用学。建议闲鱼买课。我安排的话:
1.先注册各种ai账号,然后学基本的prompt engineering,让ai介入你的学习日常。
2.vscode安装,基本的python,numpy,pandas(一两天学完最基本的就行)。
3. 直接学深度学习,用numpy搓pytorch,复现各组件(这同时把python掌握好)
4. 开始搓transformer家族及其任务,用pytorch复现transformers。
5. 进入llm,学微调。
6. 学llm应开:rag,agent,context engineering