当前位置: 首页 > news >正文

一些模型测试中的BUG和可能解决方法

一些模型测试中的BUG和可能解决方法

模型一直重复反馈相同内容的问题查找思路

如下顺序也是排查优先级

  1. 检查提示词和上下文,保证提示词中没有类似的要求,然后再查看上下文是不是占满了token长度。
  2. 检查一下选择的model是不是本身就有这样的问题
  3. 尝试增加repeat_penalty(1.05、1.1,最大1.15或者1.2),看看是否会出现不自然的反馈。
  4. 利用frequency_penalty(0.1-0.5)减少重复使用的tokens,或者使用presence_penalty(0.1-0.5)减少上线文的重复tokens。
  5. 稍微增长一点min_p(例如增长到0.1),或者增长top_p到0.85,过滤掉一些由于低概率的tokens导致的循环。
  6. 如果temperature设置的比较高,可以尝试降低一点(例如降到0.7、0.8)

模型输出太随机相关性差

如下顺序也是排查优先级

  1. 增加temperature
  2. 降低min_p到0.05,或者更低的0.03
http://www.dtcms.com/a/180953.html

相关文章:

  • PostgreSQL逻辑复制(logic replication)
  • [AI ][Dify] Dify Tool 插件调试流程详解
  • 浅聊大模型-有条件的文本生成
  • 具身智能时代的机器人导航和操作仿真器综述
  • MySQL数据库故障排查与解决方案
  • 窗口函数row_number() OVER()对每个组内的行按照特定条件进行编号
  • 免布线视频桩:智慧城市停车降本增效的破局利器
  • 《循序渐进linux》
  • AWS IoT Core与MSK集成实战:打造高可靠实时IoT数据管道
  • 【C++设计模式之Strategy策略模式】
  • 学习心得《How Global AI Policy and Regulations Will Impact Your Enterprise》Gartner
  • 文本框碰撞测试
  • C++AVL树
  • 访问网页的全过程(分步骤的详细解析)
  • 通过Linux系统服务管理IoTDB集群的高效方法
  • C++ -- string
  • C++:求分数序列和
  • 强化学习PPO算法学习记录
  • 【Pandas】pandas DataFrame clip
  • GET请求如何传复杂数组参数
  • 使用oracle goldengate同步postgresql到postgresql
  • Eclipse SWT 1 等比缩放
  • Web端项目系统访问页面很慢,后台数据返回很快,网络也没问题,是什么导致的呢?
  • 文件包含2
  • OpenCV的 ccalib 模块用于自定义标定板的检测和处理类cv::ccalib::CustomPattern()----函数calibrate
  • 火山引擎火山云主推产品
  • wpf UserControl 更换 自定义基类
  • PX4开始之旅(一)自动调参
  • Windows10 本地部署 IPFS(go-ipfs)
  • NX884NX891美光固态闪存NX895NX907