当前位置: 首页 > news >正文

第四十五篇-Tesla P40+Qwen3-30B-A3B部署与测试

环境

系统:CentOS-7
CPU: 14C28T
显卡:Tesla P40 24G
驱动: 535
CUDA: 12.2

Ollama

模型 Qwen3-30B-A3B

ollama run qwen3:30b --verbose

显存

Tue May 27 23:50:56 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.129.03             Driver Version: 535.129.03   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla P40                      Off | 00000000:03:00.0 Off |                  Off |
| N/A   36C    P0              50W / 250W |  19092MiB / 24576MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------++---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      4168      C   /usr/local/bin/ollama                     19090MiB |
+---------------------------------------------------------------------------------------+

速度

total duration:       11.091046885s
load duration:        47.799704ms
prompt eval count:    424 token(s)
prompt eval duration: 171.063992ms
prompt eval rate:     2478.60 tokens/s
eval count:           413 token(s)
eval duration:        10.845275175s
eval rate:            38.08 tokens/s

总结

速度还是箱单可以的,看了P40还可以发发热。

http://www.dtcms.com/a/216624.html

相关文章:

  • 电路图识图基础知识-主电路和辅助电路(七)
  • 网站资源加载出现401错误
  • 开源项目asp本地编译安装教程(ubuntu操作系统)
  • 数字孪生技术前沿探索:与5G/6G、区块链的深度融合及伦理治理框架构建
  • C# ToString格式说明符
  • Pic手机拼图软件:创意拼图,轻松上手
  • 【Elasticsearch】doc_as_upsert
  • Docker部署Spark大数据组件
  • HOW - 从0到1搭建自己的博客站点(三)
  • 学习黑客 Metasploit 主要组件之 Exploit
  • 开疆智能Profinet转Profibus网关连接Modicon TM5扩展模块案例
  • 2025-05-27 Python深度学习7——损失函数和反向传播
  • 【Elasticsearch】_update api的增量更新
  • Protocol Buffers 复杂嵌套编译指南:生成 C++ 代码
  • 【Elasticsearch】ingest对于update操作起作用吗?
  • spring4第2课-ioc控制反转
  • 医疗HMI设计规范解读:如何平衡合规性与用户体验?
  • 每日Prompt:古花卷
  • MySQL-5.7 修改密码和连接访问权限
  • 顶会新方向:卡尔曼滤波+目标检测
  • 从“超市收银系统崩溃”看JVM性能监控与故障定位实战
  • wordpress迁移到Hostinger
  • 【监控】pushgateway中间服务组件
  • MES生产管理系统:Java+Vue,含源码与文档,集成生产信息,实现计划、执行与监控高效协同
  • AbMole| MGCD0103(M1790,Mocetinostat)
  • 【Elasticsearch】retry_on_conflict
  • Linux:基础指令与内涵理解(下)与权限
  • [AI]大模型MCP快速入门及智能体执行模式介绍
  • Linux `cd` 命令深度解析与高阶应用指南
  • Babylon.js学习之路《九、物理引擎入门:重力、碰撞与刚体模拟》