当前位置: 首页 > news >正文

本地运行qwen3:30b-a3b速度测试

仍然使用的是ollama,运行的Q4_K_M量化版。
这个模型在相同硬件环境下对比我电脑上其他32b的模型速度(小于3 tokens/s)提升非常明显,并且可以设置是否打开思考模式。

注意: /no_think前有个空格

非思考模式:
在这里插入图片描述
思考模式:在这里插入图片描述

相关文章:

  • HTML8:媒体元素
  • 如何通过外网访问内网?对比5个简单的局域网让互联网连接方案
  • UE5 使用插件进行Audio2face和UE5的实时链接并实时输出嘴型
  • 生成式 AI:从工具革命到智能体觉醒,2025 年的质变与突破
  • Python企业级MySQL数据库开发实战指南
  • Factorio 异星工厂 [DLC 解锁] [Steam] [Windows SteamOS]
  • 第十五届蓝桥杯单片机国赛-串口解析
  • 欧拉计划 Project Euler65(e的有理逼近)题解
  • mujoco仿真器学习笔记
  • 端口安全基本配置
  • 招标专家随机抽选——设计讲解—未来之窗智能编程——仙盟创梦IDE
  • 12.模方ModelFun工具-立面修整
  • 如何在使用 docker-compose 命令时指定 COMPOSE_PROJECT_NAME ?
  • 认识Grafana及其面板(Panel)
  • 手机携号转网查询,一键查看号码是否可转网!
  • 实现滑动选择器从离散型的数组中选择
  • Vue Element UI 表单弹窗重置问题解决方案 —— 每次打开都初始化,告别残留提示!
  • Sublime PrettyJson 快捷键
  • Relay算子注册(在pytorch.py端调用)
  • 项目中为什么选择RabbitMQ
  • 【社论】三个“靠谱”为市场注入确定性
  • 詹丹|高考语文阅读题设计和答案拟制的一些缺憾
  • 中国电信财务部总经理周响华调任华润集团总会计师
  • 线下无理由退货怎样操作?线上线下监管有何不同?市场监管总局回应
  • “五一”假期全社会跨区域人员流动量超14.65亿人次
  • 广东省联社:积极推动改制组建农商联合银行工作