当前位置：首页 > news >正文

【高级篇】DeepSeek V3 vs R1架构拆解：MoE万亿参数与纯RL训练的秘密战争

news 2025/7/10 3:40:06

前言

上一篇文章总感觉意犹未尽，没有写的太深入，因此这篇文章适合有一定的深度学习理论基础的读者，本篇和下一篇我将分别探讨DeepSeek R1和V3两个模型，并整合一些网上看到的观点和资料，通过这篇文章提出自己的看法。

shell --getopts

分布式事务的产生背景及理论指导

Java基础：枚举类enum入门案例

深入浅出C++ STL：统领STL全局

RGV调度算法（三）--遗传算法

响应式数据和双向绑定关系

qt 自带虚拟键盘的编译使用记录

Unity 使UI始终朝向摄像机

Operator ＜=＞ (spaceship operator)

AI日报 - 2025年3月14日

C语言第四章数组（3）

使用 PresentMon 获取屏幕帧率

21.dirsearch：Web 路径扫描工具

C语言高级进阶3

hackme靶场攻略

CSV文件保存后内容缩在首格内

conda创建Python虚拟环境的原理

线性代数（1）用 excel 计算鸡兔同笼

d3_v7 基于 d3.arc()生成径向柱状图

CMake

多线程与并发编程面试专题