当前位置: 首页 > news >正文

ubuntu ollama+dify实践

安装ollama

官网的指令太慢了,使用以下指令加速:

export OLLAMA_MIRROR="https://ghproxy.cn/https://github.com/ollama/ollama/releases/latest/download"
curl -fsSL https://ollama.com/install.sh | sed "s|https://ollama.com/download|$OLLAMA_MIRROR|g" | sh

修改环境变量

sudo systemctl stop ollama

参考链接

vim /etc/systemd/system/ollama.service

修改Restart为No使得ollama服务不自动重启

gedit ~/.bashrc

添加以下内容

export OLLAMA_HOST=0.0.0.0:11434 #修改host,使得所有ip都可以访问。
export OLLAMA_MODELS=/media/DISK4TB/personal/lbw/.ollama/models #修改模型存储路径
export OLLAMA_KEEP_ALIVE=24h #修改模型在线时间为24h

而后运行以下指令重启ollama serve

sudo systemctl stop ollama
sudo systemctl daemon-reload
sudo systemctl start ollama
ollama serve

windosw上修改环境变量:添加链接描述

运行ollama模型

ollama run llama3.2
等待模型下载后会运行
在这里插入图片描述

安装dify

参考链接 添加链接描述

通过docker运行即可。

在dify中配置ollama模型

在浏览器输入网址:http://localhost/signin

第一次登录需要注册,如果注册完了,就登录即可。
在这里插入图片描述
在右上角点设置->模型供应商->安装模型供应商->安装ollama

参考https://docs.dify.ai/zh-hans/development/models-integration/ollama 添加ollama,如图所示。
注意,模型名称需要准确,可以通过ollama ps 获得
基础URL可以填写本地ip地址即可
在这里插入图片描述

添加知识库

参考:添加链接描述
首先pull一个embedding model。
ollama pull bge-m3
而后,在dify上添加一下,和添加LLM一样的步骤,只不过选择Text embedding
在这里插入图片描述

http://www.dtcms.com/a/67756.html

相关文章:

  • 基金交易系统的流程
  • 国产主流数据库存储类型简析
  • 接口自动化测试实战(超详细的)
  • 小程序主包方法迁移到分包-调用策略
  • Python区块链应用开发从入门到精通
  • Word 小黑第19套
  • redis 配置
  • mingw工具源码编译
  • SAP BC 记一次 DBCO 链接ORACLE DBCC 连接测试突然失败的问题
  • tomcat配置应用
  • 【区块链+ 医疗健康】基于区块链的医院诊所信息系统 | FISCO BCOS 应用案例
  • 整合记录-持续
  • 监控易东莞运维项目:it监控+机房动环监控+资产管理+配置管理
  • 滑动窗口[判断子集是否满足条件] 力扣:209 ▎2962 ▎3306
  • ArrayList底层结构和源码分析笔记
  • docker3-容器与镜像命令
  • 【算法】动态规划
  • oracle11.2.0.4 RAC 保姆级静默安装(二) DB数据库软件
  • 零信任身份安全的基本原则
  • leetCode求两数之和(第一题)
  • Qt6.8.2中JavaScript调用WebAssembly的js文件<1>
  • linux-Openmanus本地部署-AI-Agent初探
  • 【农业大数据处理与应用】实验二 随机森林算法与LSTM循环神经网络
  • Linux文件系统管理
  • Spark;scp命令,rsync命令,ssh命令
  • 技术解析与实战指南:MySQL性能优化与高效数据库迁移工具推荐
  • 深度剖析《数理化学习》期刊:数理化教育领域的学术明珠
  • JAVA使用jar包外前端
  • 统一 Elastic 向量数据库与 LLM 功能,实现智能查询
  • 文档在线协同工具ONLYOFFICE教程:如何使用宏对 PDF 表单中的特定字段执行计算