当前位置：首页 > news >正文

本地运行qwen3:30b-a3b速度测试

news 2025/10/30 12:41:31

仍然使用的是ollama，运行的Q4_K_M量化版。
这个模型在相同硬件环境下对比我电脑上其他32b的模型速度（小于3 tokens/s）提升非常明显，并且可以设置是否打开思考模式。

注意： /no_think前有个空格

非思考模式：
在这里插入图片描述
思考模式：

http://www.dtcms.com/a/174699.html

相关文章：

HTML8：媒体元素

如何通过外网访问内网?对比5个简单的局域网让互联网连接方案

UE5 使用插件进行Audio2face和UE5的实时链接并实时输出嘴型

生成式 AI：从工具革命到智能体觉醒，2025 年的质变与突破

Python企业级MySQL数据库开发实战指南

Factorio 异星工厂 [DLC 解锁] [Steam] [Windows SteamOS]

第十五届蓝桥杯单片机国赛-串口解析

欧拉计划 Project Euler65（e的有理逼近）题解

mujoco仿真器学习笔记

端口安全基本配置

招标专家随机抽选——设计讲解—未来之窗智能编程——仙盟创梦IDE

12.模方ModelFun工具-立面修整

如何在使用 docker-compose 命令时指定 COMPOSE_PROJECT_NAME ？

认识Grafana及其面板（Panel）

手机携号转网查询，一键查看号码是否可转网！

实现滑动选择器从离散型的数组中选择

Vue Element UI 表单弹窗重置问题解决方案 —— 每次打开都初始化，告别残留提示！

Sublime PrettyJson 快捷键

Relay算子注册（在pytorch.py端调用）

项目中为什么选择RabbitMQ

Ubuntu 22.04 安装配置远程桌面环境指南

Android 中解决 annotations 库多版本冲突问题

从零搭建体育比分网站完整步骤

高等数学第六章---定积分（§6.1元素法6.2定积分在几何上的应用1）

【C++游戏引擎开发】第30篇：物理引擎（Bullet）—软体动力学系统

【Linuc】深入理解 Linux 文件权限

【MySQL】-- 数据库约束

SPP 和 yolo 中的SPP

栈与队列详解及模拟实现

spring cloud gateway（网关）简介