当前位置: 首页 > news >正文

【mllm】——x64模拟htp的后端无法编译debug

mllm, qnn, x64
code:https://github.com/UbiquitousLearning/mllm

1. 问题

通过自定义qualcomm graph使用高通的htp后端进行llm推理,网络暂时只有mllm,和https://github.com/chraac/llama.cpp。qualcomm是支持x64模拟htp推理的,这样比较好debug,方便调试。但是mllm中是不支持的。因为他htp后端强制使用了libcdsprpc.so来申请内存,就是高通说的shared mem。但是这部分的问题是可以修复的,需要自己或作者出点工作量。后续的人有同样问题的可参考。

2. other

继续diss一下qualcomm不支持单op的算力调用。diss

http://www.dtcms.com/a/126146.html

相关文章:

  • MySQL深分页问题
  • 【Code】《代码整洁之道》笔记-Chapter11-系统
  • Cuto壁纸 2.6.9 | 解锁所有高清精选壁纸,无广告干扰
  • 单细胞多组学及空间组学数据分析与应用
  • 《系统分析师-浏览试卷(一)总结》
  • 元生代品牌建设:平台实现工作流(comfyui)创建与技术文档说明
  • CVE-2025-32375 | Windows下复现 BentoML runner 服务器远程命令执行漏洞
  • JavaScript:基本语法
  • 电脑的usb端口电压会大于开发板需要的电压吗
  • 【从零开始学习JVM | 第二篇】HotSpot虚拟机对象探秘
  • ai-warp 开源的Platformatic Stackable 与 AI 服务交互
  • 快速idea本地和推送到远程仓库
  • .net 使用笔记
  • 【DDR 内存学习专栏 1. -- DDR 内存带宽与 CPU 速率】
  • 【Hadoop入门】Hadoop生态之Oozie简介
  • windows sc 创建删除服务
  • Java设计模式之享元模式:从入门到架构级实践
  • 断链保护装置常见故障及解决方法
  • 关于freertos的heap_4分配内存的方式以及首次适应算法
  • 【Docker】快速部署 Certbot 并为 Nginx 服务器配置 SSL/TLS 证书
  • AI反检测如何在TikTok养号中发挥关键作用?
  • springboot--页面的国际化
  • SSM aop切面编程的学习
  • 掌握C语言文件操作:从理论到实战指南
  • 一键精准采集单网页,告别手动复制粘贴
  • 【教学类-102-08】剪纸图案全套代码08——Python点状虚线优化版本02(有空隙)+制作1图2图6图24图
  • Matlab 非线性阻尼四分之一车体被动和模糊pid控制悬架对比
  • leetcode_15. 三数之和_java
  • [蓝桥杯]R格式(CC++双语版)
  • Xdocreport实现根据模板导出word