当前位置: 首页 > news >正文

AI学习资料留档(持续更新)

一、模型部署/硬件资源

1、动态量化版部署方法、大小

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送! | 机器之心

2、

二、模型应用

1、deepseek R1+cursor使用 

不卡顿、免费的满血版DeepSeek-R1 API,在无问芯穹这里用上了,更有异构算力鼎力相助 | 机器之心

2、

三、技术研究

1、模型训练对高质量有用数据的需求,团队开发了学习影响力度量(Learning Impact Measurement, LIM)方法。通过分析模型的学习曲线,LIM 可以自动识别那些与模型学习进程高度匹配的 "黄金样本"。

大模型强化学习新发现:删减84%数据反提升效果 | 机器之心

2、一个可供参考的微调“大礼包”

DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍 | 机器之心

3、利用代码形成思维链来训练,而不是单纯用代码训练(这个感觉可以参考实践)

DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升 | 量子位

论文地址:
https://arxiv.org/abs/2502.07316
GitHub:
https://github.com/hkust-nlp/CodeIO

相关文章:

  • windows下适用msvc编译ffmpeg 适用于ffmpeg-7.1
  • 解释 Node.js 的事件循环机制,理解微任务(microtask)与宏任务(macrotask)的区别?
  • Qt监控系统远程回放/录像文件远程下载/录像文件打上水印/批量多线程极速下载
  • JVM 面试
  • 【Linux】文件系统深度解析:从基础到高级应用
  • unity学习59: 滑动条 和 滚动条 滚动区域
  • additional-spring-configuration-metadata.json实现springboot自定义提示
  • python 视频网站爬虫教程,爬虫入门教程(付安装包)
  • Java语言基础 标识符、变量
  • 泛微Ecode新增Button调用服务器中的JSP页面里的方法
  • RabbitMQ系列(五)基本概念之Queue
  • MySQL 中如何解决深度分页的问题? MySQL中 join、inner join、left join、right join区别
  • 解决 ERROR 1130 (HY000): Host is not allowed to connect to this MySQL server
  • springboot、deepseek4j、bge-m3和milvus
  • 关于“你对 Spring Cloud 的理解”详细讲解?
  • bean的管理-03.第三方bean
  • 第8章:流式海啸:数据重构
  • Yolo各个系列的模型、ResNet、Pyrimid network、VGG、PointNet、mobilenet模型
  • ES6模块化详解:导入与导出方式
  • 常用 ADB 命令汇总
  • 漯河英文网站建设/域名解析
  • 学网站建设去什么学校/网站开发工程师
  • 仙桃建设网站/关键词搜索爱站网
  • 做网站的结论和心得/手机优化专家
  • 怎么做网站自动采集数据库/十大seo公司
  • 卢湾专业网站优化公司/江苏企业网站建设