当前位置: 首页 > news >正文

泰安市网站建设公司合肥制作网站企业

泰安市网站建设公司,合肥制作网站企业,企业网站维护工作,做配资网站1、最终效果 实现了基于本地文档内容的对话问答 2、环境部署 我的机器配置是ubuntu224090di7,没有这么高也是可以跑的 2.1安装ollama 有了ollama,就可以在本地跑一个大模型了。不联网也可以运行,实现了绝对隐私和token自由。 ollama官网&…

1、最终效果

实现了基于本地文档内容的对话问答

2、环境部署

我的机器配置是ubuntu22+4090d+i7,没有这么高也是可以跑的

2.1安装ollama

有了ollama,就可以在本地跑一个大模型了。不联网也可以运行,实现了绝对隐私和token自由。

ollama官网:https://ollama.com/download   根据自己系统下载即可。

终端输入ollama不报错说明安装成功了。

然后可以在ollama模型广场下载合适的模型,https://ollama.com/search ,模型太大本地肯呢个逮捕的带不动,太小可能性能不好,需要权衡。建议先下载个1-10G的试水。

这里有很多主流模型,deepseek、qwen、微软的mistral、谷歌的gemma、meta的llama等等。

以deepseek-人为例,8b参数量的模型为4.9GB,只需要拷贝右边的命令到终端就可以自动下载了,而且支持断网续传。如果太慢需要挂代理,虚拟机的话可以用clash的7890端口作为代理转发端口。

ollama run deepseek-r1:8b

然后输入 ollama list  输出里应该包含deepseek,就说明部署成功了

然后再运行一遍 ollama run deepseek-r1:8b 就能直接在终端对话了。如果回复速度比较慢,就需要考虑还一个更小的模型。

2.2 安装ragflow

官方建议配置如下:

ragflow官方仓库:  https://github.com/infiniflow/ragflow/blob/main/README_zh.md

首先需要将仓库clone下来。

git clone https://github.com/infiniflow/ragflow

ragflow以来docker运行。所以环境中需要包含docker,此处不赘述。

由于ragflow默认下载轻量版本的镜像(v0.17.2-slim),slim并不自带embedding模型。要么需要自己再部署一个embedding模型,要么调用在线embedding模型api。这里选择下载完整版本的ragflow,避免再次配置。

为了使得下载完整版镜像,需要修改配置文件。进入ragflow文件夹的docker,修改.env文件(如果没有看到.env需要开启文件系统的“显示隐藏文件”选项)

注释84行,取消注释87行,修改成上面的样子。

然后在docker文件夹中打开终端,输入以下代码就可以运行ragflow了。

docker compose -f docker-compose.yml up -d

如果报错,可以检查自己的80端口是否被占用,docker使用在运行。

然后就能直接通过浏览器访问localhost:80了,即ragflow的操作界面

3、ragflow配置(构建知识库)

在ragflow登录页注册一个root用户,进入模型提供商页面

3.1添加模型

找到ollama,点击添加模型

按照以上配置进行,模型名称一定是完整的模型名称,不能只输入deepseek,基础url就是本机ip加上11434(11434ollama的运行端口),ip不能是127.0.0.1。最大token数就是模型输出的最大token数,由于是本地部署所以不需要api-key,r1属于chat模型。

点击系统模型设置,选择嵌入模型(完整版ragflow自带的)

3.2添加助理

然后就能在ragflow里自由的与ds聊天了,但是现在还没有外接知识库。

3.3构建知识库

新增知识库test后,参数默认即可。选择文档后,还需要点击解析才能被模型检索到。

选择知识库

3.4测试

http://www.dtcms.com/a/470694.html

相关文章:

  • chrome插件开发_chrome扩展程序开发
  • GraphQL 初学者指南
  • 天津网站建设推荐安徽秒搜科技深圳高端人力资源公司
  • 图片生成网站大连工业大学继续教育学院
  • 国外时尚设计网站展台展览
  • 用 Python 打造一个 Telegram 二手交易商城机器人
  • 广胜达建设集团网站百度上首页
  • 网站显示域名武进网站建设哪家好
  • 建立一个网站wordpress 网站备案
  • 怎么做网站图标做一个flash网站多少钱
  • MobaXterm部署项目到云服务器
  • CTF攻防世界WEB精选基础入门:command_execution
  • 正在加载类,静态数据…
  • Python语言基础入门:从零开始掌握Python编程
  • Dioxus hot-dog 总结
  • 罗湖网站 建设深圳信科学编程入门
  • 大语言模型出现幻觉的本质
  • Windows安装RabbitMQ消息队列
  • Linux中kfree内存回收函数的实现
  • 北京网站开发飞沐如何做网站的教程二维码
  • 6自由度模拟地震振动台试验系统
  • 东莞官方网站温州seo收费
  • 千亿级赛道,Robobus 赛道中标新加坡自动驾驶巴士项目的“确定性机会”
  • 滴滴自动驾驶张博:坚持负责任的科技创新,积极探索新型就业空间
  • 建设公司怎么做网站运营模拟建筑2022手机版
  • 网站设计价格网站建设与管理专业
  • (六) Dotnet在AI控制台案例启用遥测数据与工具函数调用
  • 生产线操作工行为识别方案
  • Windows下快速安装Composer教程
  • 游戏交易网站开发莱芜网红