当前位置: 首页 > news >正文

ubuntu中ollama设置记录

自己同一台电脑主机安装3080和3090显卡,测试发现ollama只默认跑在3090上;故查看一下设置,成功也把3080也运行起来了。

原因如下:

 开始设置记录:

Environment Variables:
OLLAMA_DEBUG
作用:显示额外的调试信息。
示例:export OLLAMA_DEBUG=1

OLLAMA_HOST
作用:指定 ollama 服务器的 IP 地址和端口(默认为 127.0.0.1:11434)。
示例:export OLLAMA_HOST=0.0.0.0:8080

OLLAMA_KEEP_ALIVE
作用:设置模型在内存中保持加载的时间(默认为 5m)。
示例:export OLLAMA_KEEP_ALIVE="10m"

OLLAMA_MAX_LOADED_MODELS
作用:指定每个 GPU 上可以同时加载的最大模型数。

OLLAMA_MAX_QUEUE
作用:设置允许排队的最大请求数量。

OLLAMA_MODELS
作用:指定存储模型的目录路径。

OLLAMA_NUM_PARALLEL
作用:设置允许同时处理的最大并行请求数量。

OLLAMA_NOPRUNE
作用:禁用启动时清理模型 blob 文件的功能。

OLLAMA_ORIGINS
作用:指定允许的跨域请求来源(以逗号分隔)。
示例:export OLLAMA_ORIGINS="http://example.com,https://localhost"

OLLAMA_SCHED_SPREAD
作用:强制将模型均匀分配到所有 GPU 上。

OLLAMA_FLASH_ATTENTION
作用:启用 Flash Attention(加速注意力机制)。

OLLAMA_KV_CACHE_TYPE
作用:设置 K/ V 缓存的量化类型(默认为 f16)。
示例:export OLLAMA_KV_CACHE_TYPE="q4_0"

OLLAMA_LLM_LIBRARY
作用:指定 LLM 库以绕过自动检测。

OLLAMA_GPU_OVERHEAD
作用:为每个 GPU 预留一部分 VRAM(以字节为单位)。

OLLAMA_LOAD_TIMEOUT
作用:设置模型加载的最大等待时间(默认为 5m)。
示例:export OLLAMA_LOAD_TIMEOUT="10m"

自己按照自己需求设置 

(phi) root@cl-System-Product-Name:/home/cl/桌面/临床数据# cat /etc/systemd/system/ollama.service
[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/local/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin"
Environment="OLLAMA_HOST=0.0.0.0:11434"
Environment="OLLAMA_NUM_PARALLEL=4"
Environment="OLLAMA_MAX_LOADED_MODELS=2"
Environment="CUDA_VISIBLE_DEVICES=0,1"
Environment="OLLAMA_SCHED_SPREAD=true"
DeviceAllow=gpu/*
[Install]
WantedBy=default.target

 

systemctl daemon-reload

systemctl restart ollama.service

# 确保ollama服务正常运行
systemctl status  ollama.service

 

相关文章:

  • 17106合并数列
  • 通用查询类接口数据更新的另类实现
  • 动态规划多阶段报童模型,c++ 实现, java 实现
  • 代码随想录算法训练营第33天 | 62. 不同路径 63. 不同路径 II 343. 整数拆分 96. 不同的二叉搜索树
  • I/O函数
  • 【vue-echarts】——05.柱状图
  • 从Aurora看Xanadu可扩展模块化光量子计算机的现状与未来展望
  • 设计模式Python版 观察者模式
  • 零基础安装并搭建QT的环境以及QT开发工具
  • 授权与认证之jwt(五)创建Aop切面类
  • HashMap与HashTable的区别
  • 使用【华为手机】给吉利车机升级安装第三方软件教程【保姆级教程】
  • 高频 SQL 50 题(基础版)_1193. 每月交易 I
  • win32汇编环境,窗口程序使用树形视图示例一
  • Memcached监控本机内存(比redis速度更快)
  • 浙大 DeepSeek 线上课学习笔记
  • 时态知识图谱中的补全过滤策略(过滤损坏四元组)
  • 安装第三方软件报错:Called RunScript when not marked in progress
  • 绪论(4)
  • WPF 复杂页面布局及漂亮 UI 界面设计全解析
  • 以百度云做网站空间/产品推销
  • 河南建筑信息一体化平台/长沙网站seo排名
  • 网站建设总体方案设计/中国搜索引擎排名
  • 网站源码 源码论坛 源码之家 免费源码 商业源码 源码下载/淄博百度推广
  • 广西seo网站推广/电商网站销售数据分析
  • 网站建设策略/制作网页完整步骤