DeepSeek(14):DeepSeek 模型微调
1 通用模型和专业模型对比
通用模型(基座模型)
- 无监督学习
- 通过上句猜下句,不具备专业能力
专业模型(微调模型)
- 有监督模型
- 针对业务场景
- 具备专业能力
举例说明,如下图:
左侧是基础模型(Base Model),当面对皮肤刺激、红肿和瘙痒等症状时,该模型只能给出一个简单的诊断结果:“可能是痤疮。没有足够的信息来做出更精确的诊断。
右侧是经过微调的模型(FinetunedModel),给出了更为详细的结果:“您混合了非炎症性粉刺性和炎症性丘疹脓疱性痤疮。”微调后的模型已经学习了额外的皮肤病数据,因此能提供更加精准的医疗建议或诊断。
2 Prompting(提示工程)和Finetuning(微调)对比
Prompting(提示工程)
优点:
- 无需数据即可开始
- 较小的前期成本
- 不需要技术知识
- 通过检索连接数据(RAG)
缺点:
- 数据适配较少
- 忘记数据
- 产生幻觉
- RAG可能遗漏或获取错误的数据适用场景:通用、边项目、原型开发
Finetuning(微调)
优点:
- 几乎无限的数据适配
- 学习新信息
- 纠正错误的信息
- 如果是较小的模型,后续成本较低
- 使用RAG
缺点:
- 更高质量的数据
- 前期计算成本较高
- 需要一些技术知识,尤其是关于数据的适用场景:领域特定、企业级、生产环境使用..隐私!
3