当前位置: 首页 > news >正文

探索大语言模型(LLM):Windows系统与Linux系统下的Ollama高级配置(修改模型地址、Service服务以及多卡均衡调用)


前言

在之前的探索大语言模型(LLM):Ollama快速安装部署及使用(含Linux环境下离线安装)中,已经介绍了ollama在Windows环境下和Linux环境下的安装,在本篇中将重点介绍Ollama的常用配置


修改模型存储地址

默认情况下,ollama在Linux系统中会将模型下载到/root/.ollama文件
夹中,windows系统会将模型下载到C:\Users\用户名\.ollama\models文件夹中,这种情况下模型占用的是系统盘的空间,所以最好换个路径保存。

Linux环境修改模型存储地址

vi ~/.bashrc

然后添加

export OLLAMA_MODELS=你想设置的路径

使环境变量生效

source ~/.bashrc

如果之前下载过模型,记得要把源地址的模型移动到新的路径下,如果不生效尝试重启一下ollama

sudo systemctl daemon-reload
sudo systemctl restart ollama

检查服务状态:

sudo systemctl status ollama

当无法直接通过 systemctl 重启时,可手动停止并重新启动。

查找占用端口的进程:

lsof -i :11434

终止相关进程:

kill -9 <PID>

重新启动服务:

ollama serve

Windows环境修改模型存储地址

在这里插入图片描述
在这里插入图片描述

然后点击环境变量
在这里插入图片描述

在这里插入图片描述
这里选任意一个就行
在这里插入图片描述

变量名为OLLAMA_MODELS
修改完保存即可


Service服务

如果需要局域网根据IP地址远程访问,需要修改ollama.service文件中的配置

systemctl edit ollama.service  # 两个命令选一个就行,效果一致
sudo vi /etc/systemd/system/ollama.service  # 两个命令选一个就行,效果一致

在 [Service] 部分添加环境变量:

Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_ORIGINS=*"

如果要修改端口,同样的是修改OLLAMA_HOST参数,参数修改形式如下(端口11434是ollama的默认端口,需要修改端口时只需更改这一参数即可)

Environment="OLLAMA_HOST=0.0.0.0:11434"    

保存后重新加载配置并重启:

sudo systemctl daemon-reload
sudo systemctl restart ollama

验证服务状态

netstat -tulpn | grep 11434

多卡均衡

Environment="CUDA_VISIBLE_DEVICES=0,1,2,3"    # 这里根据你自己实际的 GPU标号来进行修改
Environment="OLLAMA_SCHED_SPREAD=1"           # 这个参数是做负载均衡

其中CUDA_VISIBLE_DEVICES填写的是GPU的编号,可以通过nvidia-smi查看相关的编号
OLLAMA_SCHED_SPREAD的作用是使得模型可以均匀的在多张显卡上运行,如果不加这个配置,模型会优先选择一个性能最佳的显卡,只有显存不足时才会占用其他显卡,为了保证运行的效率,建议将这个参数设置为1

保存退出后,重新加载systemd并重新启动Ollama服务使其配置生效

systemctl daemon-reload
systemctl restart ollama

其他参数

参数名参数说明
OLLAMA_NUM_PARALLEL设置Ollama每个模型最大并行请求数,默认依可用显存自动选4或1
OLLAMA_MAX_QUEUE内存不足时新模型请求排队,按序处理,先前的模型闲置会卸载以腾空间
OLLAMA_MAX_LOADED_MODELS设置最大加载模型数量,默认3*GPU数量,超量新请求会被拒

文章转载自:

http://9WemHspa.drywd.cn
http://dXyEw7be.drywd.cn
http://KJH7npwS.drywd.cn
http://zs8eNTsC.drywd.cn
http://ZyArbznx.drywd.cn
http://SU55gbb0.drywd.cn
http://2t288QoA.drywd.cn
http://Sbi680V8.drywd.cn
http://faPlRtIC.drywd.cn
http://YSVqWD3B.drywd.cn
http://fOLkUEci.drywd.cn
http://TZ7do9Tb.drywd.cn
http://pu0TiPfU.drywd.cn
http://d9fkUvbg.drywd.cn
http://d2YQJHDD.drywd.cn
http://Ny3IybD4.drywd.cn
http://WYW4auPV.drywd.cn
http://GU2CLSKB.drywd.cn
http://J3fMGsRc.drywd.cn
http://Y6r2gaiD.drywd.cn
http://lLhNFrVX.drywd.cn
http://pPbxi89s.drywd.cn
http://6hukyjmq.drywd.cn
http://EnRi8yGn.drywd.cn
http://vTqiDqoG.drywd.cn
http://dkr9CGLH.drywd.cn
http://iEUnOZVX.drywd.cn
http://DeKI1vrp.drywd.cn
http://vKrGjIJE.drywd.cn
http://oF5MyzKx.drywd.cn
http://www.dtcms.com/a/386318.html

相关文章:

  • PowerBI实战-制作带有同比及趋势线的双柱状图
  • Spring 介绍
  • 使用爱思助手(版本8.16)将ipa安装到ios
  • 大模型应用开发2-SpringAI实战
  • 【面板数据】上市公司校企合作论文发表数据集(2002-2025年)
  • MySQL的底层数据结构:B+树
  • 【Linux】LRU缓存(C++模拟实现)
  • 冲击成本敏感度曲线驱动的拆单频率参数动态调优机制
  • Typera+Gitee+PicGo 配置markdown专用图床
  • 正则化:机器学习泛化能力的守护神
  • GCKontrol对嵌入式设备FPGA设计流程的高效优化
  • vue2+vue3-自定义指令
  • Vue基础知识点(接上篇案例)
  • 动物排队+分手厨房?合作模拟《Pao Pao》登录steam
  • 易境通货代系统:如何实现全流程自动化报关管理?
  • OpenCV:答题卡识别
  • leetcode HOT100 个人理解及解析
  • 深入落地“人工智能+”,如何构建安全、高效的算力基础设施?
  • 无人出租车(Robotaxi)还有哪些技术瓶颈?
  • 安全开发生命周期管理
  • 用住宿楼模型彻底理解Kubernetes架构(运行原理视角)
  • 【大模型】minimind2 1: ubuntu24.04安装部署 web demo
  • 扩散模型之(八)Rectified Flow
  • Facebook主页变现功能被封?跨境玩家该如何申诉和预防
  • 《Java接入支付宝沙箱支付全流程详解》
  • DevOps实战(8) - 使用Arbess+GitLab+PostIn实现Go项目自动化部署
  • 趣味学RUST基础篇(高级特征)
  • 随机森林(Random Forest)学习笔记
  • css之Flex响应式多列布局,根据容器宽度自动调整显示2列或3列布局,支持多行排列
  • HTML应用指南:利用POST请求获取全国中石化易捷门店位置信息