Instruct模型 AutoModelForCausalLM :智能指令执行专家
Instruct 模型的后缀是什么
“Instruct”通常指的是一类经过特定训练,旨在遵循指令或完成特定任务的语言模型。
模型特点
- 任务导向:在基础模型的基础上,通过指令微调(Instruction Tuning)得来。专门被设计成能够按照用户的指令执行任务,例如生成文本、回答问题、翻译等。
- 指令响应能力强:经过大量人类指令及其对应输出数据的微调,能更好地理解并按照用户输入的明确指令执行相应的任务,表现出比基础模型更好的指令执行能力。
- 用户友好:其设计更倾向于真实的应用场景,通常不需要进一步微调即可直接用于任务执行,方便用户在各种实际场景中使用。
举例
常见的 Instruct 模型如 OpenAI 的 InstructGPT 以及 <代码开始>text - davinci - 003<代码结束> 、LLaMA - 2