当前位置: 首页 > news >正文

调试bug记录

文章目录

  • 代码调试bug记录
    • 第一次计算
    • 第二次计算

代码调试bug记录

这应该是踩到什么大坑了…
之前没有怎么深度调试过LLM,这次本来想做一个可解释性实验,想着能不能看看输入到LLM中的token每个贡献度如何,就采用了积分梯度计算。

第一次计算

我的输入token是包括四个部分:

  • BLIP token
  • SlowFast token
  • Swin3D token
  • Text token

最后输出的就是这四个部分token的梯度贡献:

  • BLIP: -0.0053
  • Swin3D: 0.1027
  • SlowFast: 0.3611

但我想能不能具体看到每个token对结果的贡献度

第二次计算

我的输出相当于每个token,输出的格式是一个类似表格的结果

--- 每个Token的详细贡献度 ---type      token  contribution
0     Text          T      0.001234
1     Text          he     0.002345
...
8     Text          :      0.000123
9     BLIP    Token_0     -0.000567
10    BLIP    Token_1      0.001789
...
16    BLIP    Token_7     -0.000987
17    Text          .      0.000012
...

但是跑出来发现所有的contri都是NaN…
然后问大模型说是可能FP16溢出了,可以试试用FP32,然后我就照做,发现肯定是不可以的,因为一定会爆显存。
当我改回来的时候发现:

CUDA Setup failed despite CUDA being available. Please run the following command to get more information:python -m bitsandbytesInspect the output of the command and see if you can locate CUDA libraries. You might need to add them
to your LD_LIBRARY_PATH. If you suspect a bug, please take the information from python -m bitsandbytes
and open an issue at: https://github.com/bitsandbytes-foundation/bitsandbytes/issues

好像是cuda出问题了…
看看后续怎么解决吧,明天打算修复一下环境试试。

http://www.dtcms.com/a/282888.html

相关文章:

  • 如何用山海鲸轻松构建3D智慧大屏?
  • 【开源.NET】一个 .NET 开源美观、灵活易用、功能强大的图表库
  • 3DGS之COLMAP
  • 能行为监测算法:低成本下的高效管理
  • LIN通信协议入门
  • AI学习笔记三十一:YOLOv8 C++编译测试(OpenVINO)
  • 构建足球实时比分APP:REST API与WebSocket接入方案详解
  • PandaWiki与GitBook深度对比:AI时代的知识管理工具,选谁好?
  • 自动控制原理知识地图:舵轮、路径与导航图
  • 经典排序算法之归并排序(Merge Sort)
  • Linux内核IPv4路由查找:LPC-Trie算法的深度实践
  • 记录一道sql面试题3
  • 【Docker基础】Dockerfile多阶段构建:Multi-stage Builds详解
  • 【java面试day5】redis缓存-数据过期策略
  • MyBatis 之分页四式传参与聚合、主键操作全解
  • cv610_10B烧录,只能烧录到10%~20%,可能为DDRIO电压没有1.8v
  • Datawhale AI夏令营-基于带货视频评论的用户洞察挑战赛使用bert提升效果
  • socket和websocket的区别
  • 「大模型应用」(2)RAG的检索与rerank
  • vue页面不销毁的情况下再返回,总是执行created,而不触发 activated
  • uniapp 调起支付宝 requestPayment:fail service not found
  • 重学前端006 --- 响应式网页设计 CSS 弹性盒子
  • 2021-10-30 C++区间回文个数
  • 康华生物深耕疫苗创新 以核心产品引领行业发展
  • CSS3动画基本使用——页面一打开盒子就从左边走向右边
  • WIndows服务器中使用nssm启动多个Springboot服务
  • 外网访问禅道软件项目管理系统,简单几步将本地内网IP端口设置互联网在线用
  • Three.js 实战:使用 PBR 贴图打造真实地面材质
  • 面试150——数组字符串
  • 定位慢查询