当前位置：首页 > news >正文

MI50运算卡使用llama.cpp的ROCm后端运行Qwen3-Coder-30B-A3B的速度测试

news 2025/11/12 8:30:15

上一篇有写到如何为MI50编译ROCm版的llama.cpp，测试下吞吐速度：

使用到的模型是unsloth提供的Qwen3-Coder-30B-A3B-Instruct-UD-Q4_K_XL 量化版本。

测速如下：

ggml_cuda_init: GGML_CUDA_FORCE_MMQ:    no
ggml_cuda_init: GGML_CUDA_FORCE_CUBLAS: no
ggml_cuda_init: found 1 ROCm devices:Device 0: AMD Radeon Graphics, gfx906:sramecc-:xnack- (0x906), VMM: no, Wave Size: 64
| model                          |       size |     params | backend    | ngl |            test |                  t/s |
| ------------------------------ | ---------: | ---------: | ---------- | --: | --------------: | -------------------: |
| qwen3moe 30B.A3B Q4_K - Medium |  16.45 GiB |    30.53 B | ROCm       |  99 |           pp512 |        990.65 ± 3.12 |
| qwen3moe 30B.A3B Q4_K - Medium |  16.45 GiB |    30.53 B | ROCm       |  99 |           tg128 |         73.51 ± 0.06 |

可见在处理输入时非常快。

http://www.dtcms.com/a/597577.html

相关文章：

【图像处理基石】如何入门图像压缩编码技术？

网站建设与管理实施方案企业建设网站怎么做账

网站制作与网站建设实际报告文案发布平台

开源项目合并新分支和本地修改指南

GJOI 11.5 题解

网站建设是什么语言wan网站建设

个人网站域名怎么起企业官方网站建设的流程

CTFHub Web进阶-Json Web Token通关5：修改签名算法

华为OD机试双机位A卷 - 上班之路 (JAVA Python C++ JS GO)

CEVA-DSP开发初识（一）

峰均比降低技术（CFR）

如何删除网站备案号房地产政策

盐城网盐城网站建设站建设wordpress视频解析接口

【CPKCOR-RA8D1】Home Assistant 物联网 ADC 电压温度计

STM32外设学习--DMA直接存储器读取（AD扫描程序，DMA搬运）--学习笔记。

贵州网站开发制作公司开发公司各部门职责

FreeRTOS 学习：（十八）FreeRTOS 中断管理

做外贸网站怎么收钱池州哪里做网站

介绍一下机器人坐标转换的 RT 矩阵

网站备案换公司吗盐山县网站建设

为智能制造护航：SASE如何重塑制造业网络安全与连接

品牌授权网站什么网站可以做软件有哪些东西

h5网站系统企业网站制作排名

ZeroNews 场景案例 | 结合小皮面板实现公网web服务发布

本地的赣州网站建设电商网站支付接口

C# 记录类型（record）全面解析：从概念到最佳实践

广西响应式网站制作怎么修改自己网站内容

万网网站建设教程免费做网站的网站

Meta Omnilingual ASR：一个支持超1600种语言的语音识别系统解析

9、prometheus-PromQL-3-偏移量修改器