当前位置: 首页 > news >正文

第四十七篇-Tesla P40+Qwen3-30B-A3B部署与测试

环境

系统:CentOS-7
CPU: 14C28T
显卡:Tesla P40 24G
驱动: 535
CUDA: 12.2

Ollama

模型 Qwen3-30B-A3B

ollama run qwen3:30b --verbose

显存

Tue May 27 23:50:56 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.129.03             Driver Version: 535.129.03   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P40                      Off | 00000000:03:00.0 Off |                  Off |
| N/A   36C    P0              50W / 250W |  19092MiB / 24576MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------++---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      4168      C   /usr/local/bin/ollama                     19090MiB |
+---------------------------------------------------------------------------------------+

速度

total duration:       11.091046885s
load duration:        47.799704ms
prompt eval count:    424 token(s)
prompt eval duration: 171.063992ms
prompt eval rate:     2478.60 tokens/s
eval count:           413 token(s)
eval duration:        10.845275175s
eval rate:            38.08 tokens/s

总结

速度还是相当可以的,看来P40还可以在发发余热。

相关文章:

  • SD07_NVM的安装及相关操作
  • qiankun 子应用怎样通过 props拿到子应用【注册之后挂载之前】主应用中发生变更的数据
  • 6个月Python学习计划 Day 6 - 综合实战:学生信息管理系统
  • 【系分】论文模版
  • 开源酷炫大数据可视化大屏html+eacher 100+套
  • 2025 海外短剧 CPS 系统开发:技术驱动下的全球化内容分销新范式
  • Spark、Hadoop对比
  • Day04
  • cursor-stats 实时监控 Cursor IDE 的使用情况和订阅状态
  • 体现物联网环境下安全防护的紧迫性 :物联网环境下的个人信息安全:隐忧与防护之道
  • Linux升级内核回退到旧内核启动
  • 2025上半年软考系统架构设计师选择题试题与答案
  • spring4第2课-ioc控制反转-依赖注入,是为了解决耦合问题
  • springboot--实战--大事件--用户接口开发
  • TS.43规范-1
  • winsock对话设计框架
  • 全志V853 mpp程序开发
  • [小白]Docker部署kingbase(人大金仓)数据库[超详细]
  • Linux `pwd` 命令深度解析与高阶应用指南
  • js判断当前设备是否为移动端
  • 做seo排名好的网站/代运营一般收费
  • 微网站和微信/网络营销怎么做推广
  • 设计学类专业性网站/如何做平台推广
  • 网站建设服务条款/网页点击量统计
  • wordpress做过的大型网站/seo技巧课程
  • b2c网站建设开发/关键词收录查询工具