当前位置: 首页 > news >正文

打造个人知识库(Page Assist版)- 私人专属AI-本地化部署deepseek

上篇介绍了实现浏览器交互Ai Web Ui - chrome浏览器插件-Page Assist,安装即可使用,实现最简单的本地化部署AI使用。

实现浏览器交互Ai Web Ui-本地化部署的deepseek + Ollama + Page Assist

本编介绍使用 Page Assist 构建个人知识库,利用个人私有数据,实现私人专属AI。

一、RAG 介绍

RAG 的中文名称是检索增强生成,从字面意思来理解,包含三个检索、增强和生成三个过程。

检索:根据用户的查询内容,从外挂知识库获取相关信息。具体来说,就是将用户的查询通过嵌入模型转换成向量,以便与向量数据库中存储的知识相关的向量进行比对。通过相似性搜索,从向量数据库中找出最匹配的前 K 个数据。
增强:将用户的查询内容和检索到的相关知识一起嵌入到一个预设的提示词模板中。
生成:将经过检索增强的提示词内容输入到大语言模型(LLM)中,以此生成所需的输出。

流程图如下所示:

二、文本嵌入模型

将个人数据向量化存入向量数据库需要嵌入式模型,检索向量数据库也需要嵌入式模型。

下载嵌入式模型

浏览器打开Page Assist - 设置 - 模型管理 - 添加新模型 - 输入“nomic-embed-text:latest” - 拉取模型。

也可使用命令行下载

ollama pull nomic-embed-text:latest

等待安装完毕

也可选在安装 bge-m3 模型。

模型名称

使用场景

安装命令

nomic-embed-text

功能强大的英文文本嵌入模型

ollama pull nomic-embed-text

bge-m3

适用于多种高级自然语言处理任务

ollama pull bge-m3

三、RAG设置

设置 - RAG设置 - 文本嵌入模型 - 选择“nomic-embed-text:latest” - 保存,其他设置暂默认即可。

四、知识库数据

用 Deepseek 虚构了一个人物的全套资料,包含个人档案、简历、教育经历、工作成果、新闻介绍等内容,有TXT、MD、DOC、PPT、PDF等格式。方便用于deepseek本地化部署+个人知识库测试。

虚构人物的全套资料提供给大家免费下载使用。

下载地址:余傲天-虚拟人物资料-deepseek本地化部署+个人知识库测试

五、导入个人数据

设置 - 管理知识 - 添加知识 - 选择上传文件- 提交。

Page Assist 单个知识库默认文件上传限制为5个文档,可在RAG设置里修改,但不支持追加文档。

后续再给大家介绍其他知识库管理能力更强的工具,关注后续文章。

稍等一会,导入处理完成。

六、应用知识库

不使用知识库

使用知识库

选择知识库:

Deepseek 1.5b 提问:

模型确实引用了知识库的内容进行回复,并在文末列出引用文档

Deepseek 7b 提问:

七、总结

综上结论:

Deepseek 1.5b 模型,回答效果不太理想。Deepseek 7b 模型,回答效果比1.5b 效果要好很多。明显回答更加精准更富有逻辑性。参数越多的大模型回答效果越好。

Page Assist 插件知识库管理能力较弱,用于简单测试尚可,实际应用还差点意思。

后续更新其他更好用的工具,并且可以用个人知识库+Deepseek 官方API,打造更实用的私人专属AI。

相关文章:

  • Leetcode 49: 字母异位词分组
  • vue原理面试题
  • 浏览器注入可以实现同时进行n个浏览器注入的方案
  • JavaWeb-社区版Idea安装配置
  • Spring Boot 与 MyBatis 版本兼容性
  • 简述下Spark中的自带的standalone集群管理的任务执行流程
  • 【决策树】分类属性的选择
  • Linux端口映射
  • 图解KV Cache:解锁LLM推理效率的关键
  • NVIDIA GPU 系列简单介绍
  • Vue盲区扫雷
  • oracle decode
  • WireGuard搭建网络,供整个公司使用
  • 自动计算相机pose,pyrender渲染例子
  • QILSTE H6-C210TCG高亮翠绿光LED灯珠 发光二极管LED
  • 使用 `#pragma comment(lib, “xxx.lib“)` 简化 DLL 依赖管理
  • (十 八)趣学设计模式 之 观察者模式!
  • vscode通过ssh远程连接(linux系统)不能跳转问题
  • CSS—显示模式display、定位position、元素溢出overflow、float浮动
  • 【入门Web安全之前端学习的侧重点和针对性的建议】
  • 做景观素材有哪几个网站/seo关键词优化经验技巧
  • 游戏公司官方网站建设方案/广州百度网站快速排名
  • 沙坪坝城乡建设建委网站/肇庆疫情最新消息
  • 郓城做网站哪家好/爱站网官网查询域名
  • 郑州做网站和域名/广告点击一次多少钱
  • 机关网站建设方案/网络营销推广方式有哪些