当前位置：首页 > news >正文

MI50运算卡使用llama.cpp的ROCm后端运行gpt-oss-20b的速度测试

news 2025/11/12 4:58:16

使用unsloth提供的 gpt-oss-20b-UD-Q4_K_XL 量化版本

llama.cpp:b6987

ggml_cuda_init: GGML_CUDA_FORCE_MMQ:    no
ggml_cuda_init: GGML_CUDA_FORCE_CUBLAS: no
ggml_cuda_init: found 1 ROCm devices:Device 0: AMD Radeon Graphics, gfx906:sramecc-:xnack- (0x906), VMM: no, Wave Size: 64
| model                          |       size |     params | backend    | ngl |            test |                  t/s |
| ------------------------------ | ---------: | ---------: | ---------- | --: | --------------: | -------------------: |
| gpt-oss 20B Q4_K - Medium      |  11.04 GiB |    20.91 B | ROCm       |  99 |           pp512 |       1109.90 ± 7.26 |
| gpt-oss 20B Q4_K - Medium      |  11.04 GiB |    20.91 B | ROCm       |  99 |           tg128 |        106.59 ± 0.03 |

http://www.dtcms.com/a/596286.html

相关文章：

聊聊关于hive“中文乱码”问题

一般建设网站需要多少预算酷站网站

ASP.NET 实战：用 CSS 选择器打造一个可搜索、响应式的书籍管理系统

消息队列防止数据丢失问题

Spring Cloud Bus 事件广播机制

广州巨腾建网站公司郑州网站app开发

银河麒麟服务器安装图形化界面

【源码+文档+调试讲解】基于Spring Boot的考务管理系统设计与实现 085

LeetCode 421 - 数组中两个数的最大异或值

【笔记】xFormers版本与PyTorch、CUDA对应关系及正确安装方法详解

【GitHub每日速递 20251111】PyTorch：GPU加速、动态网络，深度学习平台的不二之选！

多产品的网站怎么做seo做音乐网站之前的准备

网站如何做h5动态页面设计万网备案初审过了后网站能访问吗

centos运维常用命令

在CentOS 7.6系统中找回或重置 root 密码

濮阳团购网站建设手机网站模板psd

基于Spring Boot的电子犬证管理系统设计与实现

Spring Boot 中的定时任务：从基础调度到高可用实践

家装设计师网站wordpress小清新模板

用WordPress制作单页相城seo网站优化软件

wordpress主题wpmee江门网站优化排名

淮安设计网站苏州网站建设相关技术

公司的网站开发费计入什么科目济南传承网络李聪

营销类型的公司网站物联网平台功能

做网站设计都需要什么杭州建设信息网

惠州网站设计哪家好网站内的搜索怎么做的

网站域名使用费用上海十大猎头公司排名

网站建站程序wordpress salient

舞蹈网站模板权威做网站的公司

互联网创新创业大赛seo推广培训中心