当前位置：首页 > news >正文

Qwen2.5 0.5b转换到iree上支持的文件

news 2025/9/27 11:03:44

下载文件

modelscope download --model="Qwen/Qwen2.5-0.5B-Instruct" --local_dir ./model-dir

下载的文件转成onnx格式

optimum-cli export onnx --model model-dir/ --task text-generation-with-past --opset 14 --atol 1e-3 model-dir_onnx/

onnx转成iree上的mlir

iree-import-onnx model-dir_onnx/model.onnx -o qwen2_5_05b.mlir

转成各个平台运行的vmfb

cpu:

iree-compile qwen2_5_05b.mlir --iree-hal-target-backends=llvm-cpu --iree-llvmcpu-target-cpu-features=host --iree-llvmcpu-enable-ukernels=all -o qwen2_5_05b_cpu.vmfb

android cpu:

iree-compile --iree-hal-target-backends=llvm-cpu --iree-llvmcpu-target-triple=aarch64-linux-android31 --iree-llvmcpu-enable-ukernels=all --iree-opt-const-eval=true qwen2_5_05b.mlir -o qwen2_5_05b_android.vmfb

android gpu vulkan

iree-compile --iree-hal-target-device=vulkan --iree-vulkan-target=adreno --iree-opt-const-eval=true qwen2_5_05b.mlir -o qwen2_5_05b_android_gpu.vmfb

测试方法

../iree-run-module --device=local-sync --module=qwen2_5_05b_android.vmfb --function=main_graph --input=@input_ids.npy --input=@attention_mask.npy --input=@position_ids.npy $(for i in {0..23}; do echo --input=@past_k_${i}.npy --input=@past_v_${i}.npy; done)

http://www.dtcms.com/a/411512.html

相关文章：

做网站和平台多少钱网络营销seo是什么

Qt常用控件之QCalendarWidget

做金属小飞机的网站怎么做网络推广网站

利用php做网站教程吃货盒子 wordpress

行政事业单位网站建设直播网站如何做

安装xdebug调试工具(docker容器+vscode编辑器+xdebug)

成都seo培训学校济宁网站建设seo

SpringBoot邮件发送的5大隐形地雷与避坑实战指南

撼动GPT-5地位？阿里万亿参数Qwen3-Max模型发布，使用教程来了

三亚市住房和城乡建设厅网站防城港网站设计

西安网址开发网站制作网站后台管理系统设计

HCIP-IoT 真题详解（章节D），嵌入式基础与南向开发 /Part2

如何修改wordpress模板首页宽度做企业网站排名优化要多少钱

守护品牌信誉，激光镭射防伪标签为您筑起安全防线

网站开发课程有哪些龙岩兼职网招聘

Unity 虚拟仿真实验中设计模式的使用 ——状态模式（State Pattern）

常见限流策略对比

福建省城乡和建设厅网站陕西网站开发公司

宝山手机网站制作公司那个可以做棋牌网站

360免费建站怎么样排名优化软件点击

如何用vw实现B站手机端底部的《打开app看你想看的视频？》

做自己的网站挣钱境外网站服务器

疑问：hfish的一个bug，很奇怪

河北电子商务网站建设中国住房和城乡建设部网站造价师注册

大连市网站建设大良网站建设基本流程

vue3+ts实现拖拽缩放，全屏

酒店网站开发方案用php做的网站论文

Python03——逻辑判断

福田做棋牌网站建设找哪家效益快小程序制作用华网天下北京

动力电池与储能电池行业研究报告