当前位置: 首页 > news >正文

一些模型测试中的BUG和可能解决方法

一些模型测试中的BUG和可能解决方法

模型一直重复反馈相同内容的问题查找思路

如下顺序也是排查优先级

  1. 检查提示词和上下文,保证提示词中没有类似的要求,然后再查看上下文是不是占满了token长度。
  2. 检查一下选择的model是不是本身就有这样的问题
  3. 尝试增加repeat_penalty(1.05、1.1,最大1.15或者1.2),看看是否会出现不自然的反馈。
  4. 利用frequency_penalty(0.1-0.5)减少重复使用的tokens,或者使用presence_penalty(0.1-0.5)减少上线文的重复tokens。
  5. 稍微增长一点min_p(例如增长到0.1),或者增长top_p到0.85,过滤掉一些由于低概率的tokens导致的循环。
  6. 如果temperature设置的比较高,可以尝试降低一点(例如降到0.7、0.8)

模型输出太随机相关性差

如下顺序也是排查优先级

  1. 增加temperature
  2. 降低min_p到0.05,或者更低的0.03

相关文章:

  • PostgreSQL逻辑复制(logic replication)
  • [AI ][Dify] Dify Tool 插件调试流程详解
  • 浅聊大模型-有条件的文本生成
  • 具身智能时代的机器人导航和操作仿真器综述
  • MySQL数据库故障排查与解决方案
  • 窗口函数row_number() OVER()对每个组内的行按照特定条件进行编号
  • 免布线视频桩:智慧城市停车降本增效的破局利器
  • 《循序渐进linux》
  • AWS IoT Core与MSK集成实战:打造高可靠实时IoT数据管道
  • 【C++设计模式之Strategy策略模式】
  • 学习心得《How Global AI Policy and Regulations Will Impact Your Enterprise》Gartner
  • 文本框碰撞测试
  • C++AVL树
  • 访问网页的全过程(分步骤的详细解析)
  • 通过Linux系统服务管理IoTDB集群的高效方法
  • C++ -- string
  • C++:求分数序列和
  • 强化学习PPO算法学习记录
  • 【Pandas】pandas DataFrame clip
  • GET请求如何传复杂数组参数
  • 智利观众也喜欢上海的《好东西》
  • 婚姻登记“全国通办”首日,上海虹口登记中心迎来“甜蜜高峰”
  • 股价两天涨超30%,中航成飞:不存在应披露而未披露的重大事项
  • 秦洪看盘|受阻回落,蓄积新做多能量
  • 陕南多地供水形势严峻:有的已呼吁启用自备水井
  • 潘功胜:降准0.5个百分点,降低政策利率0.1个百分点