当前位置：首页 > news >正文

多卡跑ollama run deepseek-r1

news 来源：原创 2025/7/1 5:08:02

# 设置环境变量并启动模型
export CUDA_VISIBLE_DEVICES=0,1,2,3
export OLLAMA_SCHED_SPREAD=1 # 启用多卡负载均衡
ollama run deepseek-r1:32b

若 deepseek-r1:32b 的显存需求未超过单卡容量（如单卡 24GB），Ollama 不会自动启用多卡

在run一个8b的就可以看出来多卡了

相关文章：

Android Kotlin权限管理最佳实践

看之前熟悉双亲委派加载机制，看之后了解双亲委派加载机制

最大子树和--树形dp

Linux基础第四天

fastadmin 数据导出，设置excel行高和限制图片大小

在Excel中使用函数公式时，常见错误对应不同的典型问题

Python学习笔记--使用Django操作mysql

一键启动多个 Chrome 实例并自动清理的 Bash 脚本分享！

AWS EKS IP 耗尽：原因、解决方案和最佳实践

【AWS入门】AWS身份验证和访问管理（IAM）

【Windows系统】向量数据库Milvus安装教程

Win10 安装单机版ES(elasticsearch),整合IK分词器和安装Kibana

鸿蒙PC操作系统：从Linux到自研微内核的蜕变

手机内存不够，哪些文件可以删？

小红书的视频怎么保存没有水印（方法分享）

linux——mysql故障排查与生产环境优化

Python打卡DAY30

MySQL函数触发：函数处理与触发器自动化应用

Node 服务监控及通过钉钉推送告警提醒

实战教程：影刀RPA采集闲鱼商品并分享钉钉