DeepSeek进阶
DeepSeek是什么
DeepSeek-R1是开源的推理模型,性能对其OpenAI-o1,可免费商用。
DeepSeek在后训练阶段大规模使用了强化学习。
DeepSeek还能完成常规绘图,例如SVG矢量图,Mermaid图表,React图表。
推理模型
区分推理大模型和非推理大模型
在提示语上,策略有所差异,
- 推理模型提示语更简洁,只需明确任务目标和需求,模型自动生成结构化推理过程
- 通用模型,显式引导推理步骤,依赖提示语补偿能力短板
策略类型
- 指令驱动
- 需求导向
- 混合模式
- 启发式提问
关键策略
- 精准定义任务,减少模糊性
- 适当分解复杂任务,降低AI认知负荷
- 引入引导性问题,提升生成内容的深度
- 控制提示语长度,确保生成的准确性
- 灵活运用开放式提示与封闭式提示
提示语类型
- 指令型提示语
- 问答型提示语
- 角色扮演型提示语
- 创意型提示语
- 分析型提示语
- 多模态提示语
参考
天津大学《深度解读:DeepSeek原理与效应》
清华大学《DeepSeek从入门到精通》