当前位置: 首页 > news >正文

一种简易的python c++协同定位和dump数据的方式

在vllm和pytorch的开发过程中,有时候需要在vllm层和pytorch层,在某一时刻同时dump数据。

可以采用如下方法去铆钉该时刻

  • 环境变量

python端可以如下设置

if(attn_metadata.prefill_metadata is not None or not USE_DECODER_LAYER_FUSE_MODE):for i in range(self.start_layer, self.end_layer):#                if i % 2 == 1:#    os.environ['DUMP_FILE'] = str(i%2)if i == 32:save_tensor = Trueos.environ['DUMP_FILE'] = str(save_idx+1)else:save_tensor = Falseos.environ['DUMP_FILE'] = "0"

在torch端,可以铆钉该环境变量,来决定是否dump

auto env_str = c10::str(getenv("DUMP_FILE"));bool save = false;if(env_str != c10::str("0")) {//std::cout << "enableing...... dumpling..." << std::endl;save = true;}//std::cout << "fuse mla info is " << env_str << "device is:" << int(at::device_of(qkv_a)->index()) << std::endl;

局限性:要确保在一个进程内

http://www.dtcms.com/a/512011.html

相关文章:

  • 蒙帕视角丨图像高效端到端目标检测
  • 孟村网站建设虚拟资源站码支付wordpress
  • xv6 源码精读(二)开启MMU、一致性映射页表
  • 珠海网站建设尚古道策略长沙口碑好网站建设公司
  • =word插入公式后行距变大怎么办?-笔记
  • Android 接入 Google 和 Facebook 第三方登录指南(初始版)
  • Aspose.words关于builder.CellFormat.Width、row.Cells[0].CellFormat.Width的设置单元格宽度区别
  • 罗湖网站建设的公司哪家好阳泉做网站公司
  • 口碑好的共晶贴片机公司
  • 挑战概率直觉:蒙提霍尔问题的解密与应用
  • 网站域名哪些后缀更好给自己公司做个网站
  • 算法笔记 07
  • Steps + Input.TextArea + InfiniteScroll 联调优化
  • /dev/mem 原理及使用
  • 机关网站建设 方案泰安新闻完整版
  • Endpoint
  • 阿里巴巴双11微服务智能监控体系:从全链路追踪到AI自愈的技术实践
  • 在ros2 humble版本上安装D455相机并获取图像和深度信息
  • C++DirectX9坐标系与基本图元之渲染状态(RenderState)_0304
  • 网站建设app长春seo技术
  • 【C++】力扣hot100错误总结
  • C++中的vector讲解
  • 笔记【字符串,转义字符,注释】
  • visual studio安装本地帮助手册
  • 北京市基础建设质量监督局网站wordpress 插件怎么看
  • 大模型技术分析与演进逻辑
  • 苏州模板网站建站长沙网站建设推广
  • 从零起步学习MySQL || 第六章:MySQL数据库中的一条数据是如何存储的?(结合源码深度解析)
  • 微信小程序页面配置,基本语法,页面切换,tabbar全局配置
  • 数据结构 07