当前位置: 首页 > news >正文

第四十五篇-Tesla P40+Qwen3-30B-A3B部署与测试

环境

系统:CentOS-7
CPU: 14C28T
显卡:Tesla P40 24G
驱动: 535
CUDA: 12.2

Ollama

模型 Qwen3-30B-A3B

ollama run qwen3:30b --verbose

显存

Tue May 27 23:50:56 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.129.03             Driver Version: 535.129.03   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P40                      Off | 00000000:03:00.0 Off |                  Off |
| N/A   36C    P0              50W / 250W |  19092MiB / 24576MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------++---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      4168      C   /usr/local/bin/ollama                     19090MiB |
+---------------------------------------------------------------------------------------+

速度

total duration:       11.091046885s
load duration:        47.799704ms
prompt eval count:    424 token(s)
prompt eval duration: 171.063992ms
prompt eval rate:     2478.60 tokens/s
eval count:           413 token(s)
eval duration:        10.845275175s
eval rate:            38.08 tokens/s

总结

速度还是箱单可以的,看了P40还可以发发热。

相关文章:

  • 电路图识图基础知识-主电路和辅助电路(七)
  • 网站资源加载出现401错误
  • 开源项目asp本地编译安装教程(ubuntu操作系统)
  • 数字孪生技术前沿探索:与5G/6G、区块链的深度融合及伦理治理框架构建
  • C# ToString格式说明符
  • Pic手机拼图软件:创意拼图,轻松上手
  • 【Elasticsearch】doc_as_upsert
  • Docker部署Spark大数据组件
  • HOW - 从0到1搭建自己的博客站点(三)
  • 学习黑客 Metasploit 主要组件之 Exploit
  • 开疆智能Profinet转Profibus网关连接Modicon TM5扩展模块案例
  • 2025-05-27 Python深度学习7——损失函数和反向传播
  • 【Elasticsearch】_update api的增量更新
  • Protocol Buffers 复杂嵌套编译指南:生成 C++ 代码
  • 【Elasticsearch】ingest对于update操作起作用吗?
  • spring4第2课-ioc控制反转
  • 医疗HMI设计规范解读:如何平衡合规性与用户体验?
  • 每日Prompt:古花卷
  • MySQL-5.7 修改密码和连接访问权限
  • 顶会新方向:卡尔曼滤波+目标检测
  • 网上免费发布信息/百度竞价优化排名
  • 山西省建设厅网站查询/东莞网站推广大全
  • 泉州哪里有搭建网站的公司/青岛seo全网营销
  • 建材企业网站营销怎么做/搜一搜排名点击软件
  • 做订购网站/线上商城推广软文
  • 嘉兴平湖网站建设/一个网站可以优化多少关键词