当前位置：首页 > news >正文

Datawhale Ollama教程笔记5

news 2025/10/15 9:54:39

Dify 接入 Ollama 部署的本地模型

Dify 支持接入 Ollama 部署的大型语言模型推理和 embedding 能力。

快速接入

下载 Ollama

访问 Ollama 安装与配置，查看 Ollama 本地部署教程。
运行 Ollama 并与 Llama 聊天
```
ollama run llama3.1Copy to clipboardErrorCopied
```
启动成功后，ollama 在本地 11434 端口启动了一个 API 服务，可通过 http://localhost:11434 访问。

其他模型可访问 Ollama Models 了解详情。
在 Dify 中接入 Ollama

在 设置 > 模型供应商 > Ollama 中填入：
- 模型名称：llama3.1
- 基础 URL ：http://<your-ollama-endpoint-domain>:11434
  
  此处需填写可访问到的 Ollama 服务地址。
  
  若 Dify 为 docker 部署，建议填写局域网 IP 地址，如：http://192.168.1.100:11434 或 docker 宿主机 IP 地址，如：http://172.17.0.1:11434。
  注：查找局域网 IP 地址命令：
  - 在 Linux/macOS 上，使用命令 ip addr show 或 ifconfig。
  - 在 Windows 上，使用 ipconfig 命令查找类似的地址。
  - 通常，这个地址会在 eth0 或 wlan0 接口下显示，取决于你是使用有线网络还是无线网络。
  若为本地源码部署，可填写 http://localhost:11434。
- 模型类型：对话
- 模型上下文长度：4096
  
  模型的最大上下文长度，若不清楚可填写默认值 4096。
- 最大 token 上限：4096
  
  模型返回内容的最大 token 数量，若模型无特别说明，则可与模型上下文长度保持一致。
- 是否支持 Vision：是
  
  当模型支持图片理解（多模态）勾选此项，如 llava。
点击 "保存" 校验无误后即可在应用中使用该模型。

Embedding 模型接入方式与 LLM 类似，只需将模型类型改为 Text Embedding 即可。
使用 Ollama 模型

进入需要配置的 App 提示词编排页面，选择 Ollama 供应商下的 llama3.1 模型，配置模型参数后即可使用。

http://www.dtcms.com/a/30158.html

相关文章：

Rust编程语言入门教程（七）函数与控制流

什么是LoRA微调

SpringBoot详解

使用爬虫按关键字搜索亚马逊商品：实战指南

AWS-SAA中文版题库

【c语言初阶】函数_递归和迭代

计算机专业知识【深入理解 IP 地址与子网掩码：从 /27 到不同 CIDR 表示】

PyTorch 源码学习：Dispatch Autograd Operators

《炒股养家心法.pdf》 kimi总结

京东cfe滑块分析

在VSCode中接入deepseek

优化YOLOv8：如何利用ODConv卷积解决复杂背景下的目标识别问题

为什么要用 const 和 let，而不是 var？

Solon Cloud —— 介绍

Pytorch实现之GIEGAN（生成器信息增强GAN）训练自己的数据集

The First项目报告：重塑链上游戏生态，解读B3 Base的双赢局面

操作系统研究

新版Tomcat MySQL IDEA 安装配置过程遇到的问题

Linux----线程

ES6箭头函数：从基础到进阶指南

【Pandas】pandas Series reset_index

如何在 SpringBoot 项目使用 Redis 的 Pipeline 功能

Spring Boot接收参数的19种方式

【JAVA：list中再定义一个list对象，循环赋值不同的list数据，出现追加重复数据问题】

跟着柳叶刀数字健康，学习如何通过病理切片预测分子分类对预后的影响｜项目复现

我是如何从 0 到 1 找到 Web3 工作的？

嵌入式之总线

乐享数科：供应链金融—三个不同阶段的融资模式

探秘IP地址与MAC地址：网络世界的身份标识

自然语言处理NLP 02统计语言模型