Deepseek搭建本地知识库
上一篇文章我们已经能够在本地运行deepseek大模型,本章我们将希望能够搭建本地的知识库。
一、基于AnythingLLM搭建
前文我们已经下载和安装了AnythingLLM ,本文中将其打开进行设置:
接着配置AnythingLLM,不过我几乎没有配置就直接用了。
配置向量数据库:
这里点开的样子是这样的
再选择嵌入的首选项
看了一下,这里面也有很多的下拉嵌入提供商,自己可以选择。
然后i就可以用了。具体怎么用,自己试一试,主要是可以选择上传自己的文件。
然后选择你需要的本话题的文档,转到右边去。
然后点右下角的“save and Embed",可是我的出现错误提示,估计是上传联网出错。
好了,这个就到这里,接着看看cherry studio的搭建方法。
二、基于Cherry Studio搭建
1、安装嵌入模型
使用本地服务,安装嵌入模型,用于将文本数据转化为向量标识的模型。本文我们下载的是bge-m3模型。BGE-M3 是一种先进的文本嵌入模型,由智源研究院(BAAI)开发,具有多功能、多语言和多粒度的特性。它在自然语言处理(NLP)和信息检索(IR)领域有广泛的应用。
ollama pull bge-m3
2、下载安装cherry studio
注意不要装在C盘,注意不要装在C盘,注意不要装在C盘!
官网网址
下载地址:
用迅雷下载吧
地址是github的,由于墙的原因,网站下不了的,用迅雷下吧!迅雷立功了!
下载安装没啥说的。
3、配置cherry studio
选择这两个模型,然后关闭对话框
点击知识库,添加
4、添加知识库文档
cherry非常方便的可以加入目录当中的文档,其他的也可以,如下所示:
选择了知识库目录之后,那个小圈圈就开始工作了,直到他全部变成蓝色圈圈为止。
下图是正在加载和整理
这是搞定了
测试一下:
这个感觉只有关键字匹配,看看大模型搜索会不会好些。
首先在cherry studio中进行大模型设置:
特别提醒的是第4步,需要选择自己本地的大模型也可以选择线上的模型:
测试一下结果:
首先确实是本地知识库的内容,其次,这个结果不算好,可能因为数据太少吧?
如果本地知识库有不想透露的数据,一定不要联网。
所以这样看来,用CherryStudio的本地知识库大模型问答系统还是比较方便建立的。因为可以对目录进行批量导入!这个就比AnythingLLM 好用。好了就先到这里!
【更新时间】:2025年2月19日21点03分