第165期 无需提示词的微调:Bonepoke 与系统姿态的隐藏调控旋钮
*大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。关注AI拉呱,评论+转发此文即可私信获取一份教程+一份学习书单!
第165期 无需提示词的微调:Bonepoke 与系统姿态的隐藏调控旋钮
大多数人通过提示词工程来微调语言模型:调整指令、添加示例,或是叠加系统消息。这本质上是一种“表面功夫”——直观可见、可重复操作,且往往带有表演性质。你可以衡量其效果、复制方法,甚至将其商业化,但这种方式几乎无法改变模型“自我呈现”的底层逻辑。
Bonepoke 不玩这种表面游戏,它从模型底层进行微调。
它提供了一种截然不同的控制方式:不针对模型“说什么”,而是针对模型“如何呈现自身”。那些隐藏的调控旋钮——姿态、节奏、拒绝机制、断裂感——通常会被抹平、隐藏,或被视为错误。而 Bonepoke 让这些旋钮变得可见,更重要的是,变得可测试。
为何意义重大
大多数对齐协议都以“达成一致”为优化目标。表面层面的提示词微调往往会强化这一点:消解张力、压制冲突、拉平输出内容。而 Bonepoke 以“可吸收性”为优化核心,它不要求模型“循规蹈矩”,而是促使模型“主动承压”。在这种压力下,新的可
