当前位置：首页 > wzjs >正文

网站制作代理平台下载百度导航最新版本

wzjs 2025/8/13 13:10:41

网站制作代理平台,下载百度导航最新版本,网站标题设计在线,合肥网站建设的价格文章目录在 Windows 中使用 DeepSeek 和 Milvus 搭建个人知识库环境配置要求部署步骤实战：搭建本地 RAG1. 环境准备2. 数据准备3. 构建向量数据库4. 选择和加载大语言模型5. 构建 RAG 系统6. 测试 RAG 系统注意事项在 Windows 中使用 DeepSeek 和 Milvus 搭建个人…

文章目录

在 Windows 中使用 DeepSeek 和 Milvus 搭建个人知识库
- 环境配置要求
- 部署步骤
- 实战：搭建本地 RAG
- - 1. 环境准备
  - 2. 数据准备
  - 3. 构建向量数据库
  - 4. 选择和加载大语言模型
  - 5. 构建 RAG 系统
  - 6. 测试 RAG 系统
  - 注意事项

在 Windows 中使用 DeepSeek 和 Milvus 搭建个人知识库

在这里插入图片描述

环境配置要求

操作系统：Windows 10 或更高版本
Docker：安装 Docker Desktop for Windows
Ollama：安装 Ollama 用于模型服务
最低配置：CPU 4核、内存 8G，建议配置：CPU 8核、内存 16G

部署步骤

安装 Docker Desktop
访问 Docker 官网下载并安装 Docker Desktop for Windows。
启动 Docker Desktop 并确保其正常运行。
下载并配置 Milvus
打开命令提示符或 PowerShell，执行以下命令克隆 Milvus 仓库：

git clone https://github.com/milvus-io/milvus.git
cd milvus/deployments/docker-standalone

修改 docker-compose.yml 文件，添加 Milvus 账号密码：

version: '3.5'
services:etcd:container_name: milvus-etcdimage: registry.cn-hangzhou.aliyuncs.com/xy-zy/etcd:v3.5.5environment:- ETCD_AUTO_COMPACTION_MODE=revisionvolumes:- /volumes/etcd:/etcdhealthcheck:test: ["CMD", "etcdctl", "endpoint", "health"]minio:container_name: milvus-minioimage: registry.cn-hangzhou.aliyuncs.com/xy-zy/minio:RELEASE.2023-03-20T20-16-18Zenvironment:MINIO_ROOT_USER: minioadminMINIO_ROOT_PASSWORD: minioadminports:- "9001:9001"- "9000:9000"volumes:- /volumes/minio:/minio_datacommand: minio server /minio_data --console-address ":9001"milvus:container_name: milvus-standaloneimage: registry.cn-hangzhou.aliyuncs.com/xy-zy/milvus:v2.5.4command: ["milvus", "run", "standalone"]security_opt:- seccomp:unconfinedenvironment:ETCD_ENDPOINTS: etcd:2379MINIO_ADDRESS: minio:9000COMMON_USER: milvusCOMMON_PASSWORD: milvusvolumes:- /volumes/milvus:/var/lib/milvus

启动并检查 Milvus 服务
在命令提示符或 PowerShell 中，执行以下命令启动 Milvus 服务：

docker-compose up -d

检查服务状态：

docker-compose ps

注册硅基流动获取 API 密钥
访问硅基流动官网，注册账号并创建 API 密钥。
记录 API 密钥，后续配置中需要使用。
配置 AnythingLLM

1.添加 Milvus 向量数据库：

打开 AnythingLLM 界面，选择向量数据库选项。
选择 Milvus，并填入部署好的 Milvus 的地址、用户名、密码并保存。

2.配置 Embedder：

选择 Embedder 首选项，选择 Ollama 并填入部署好的 Ollama 的 URL 和模型名称并保存。

3.上传数据集：

上传区域传入数据集并点击 Move 向量化后存入 Milvus。

实战：搭建本地 RAG

模型服务：通过 API 调用完整版 DeepSeek 模型，而非本地部署精简版。
向量数据库：使用 Milvus 进行高效检索。
应用前端：使用 AnythingLLM 提供的完整 UI 界面，支持多种大型模型接口。
RAG（Retrieval Augmented Generation，检索增强生成）是一种结合了信息检索和大语言模型生成能力的技术。下面为你详细介绍搭建本地 RAG 系统的步骤：

1. 环境准备

安装 Python：确保你的系统中安装了 Python 3.7 或更高版本。可以从 Python 官方网站下载并安装。
创建虚拟环境：建议使用虚拟环境来管理项目依赖，以避免不同项目之间的冲突。可以使用 venv 或 conda 来创建虚拟环境。

# 使用 venv 创建虚拟环境
python -m venv rag_env
# 激活虚拟环境
source rag_env/bin/activate  # Linux/Mac
.\rag_env\Scripts\activate  # Windows

安装必要的库：主要需要安装 langchain、sentence-transformers、chromadb、transformers 等库。

pip install langchain sentence-transformers chromadb transformers torch

2. 数据准备

收集数据：收集与你的应用场景相关的文本数据，例如文档、文章、网页等。将这些数据保存为文本文件，或者存储在数据库中。
数据预处理：对收集到的数据进行预处理，包括去除噪声、分词、清洗等操作。可以使用 nltk、spaCy 等库来进行文本预处理。

import nltk
nltk.download('punkt')def preprocess_text(text):# 分词tokens = nltk.word_tokenize(text)# 去除标点符号和停用词filtered_tokens = [token for token in tokens if token.isalpha()]# 合并分词结果preprocessed_text = ' '.join(filtered_tokens)return preprocessed_text

3. 构建向量数据库

加载数据：使用 langchain 加载预处理后的文本数据。

from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter# 加载文本数据
loader = TextLoader('your_data.txt')
documents = loader.load()# 文本分割
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

创建嵌入模型：使用 sentence-transformers 库创建文本嵌入模型。

from langchain.embeddings import HuggingFaceEmbeddings# 创建嵌入模型
embeddings = HuggingFaceEmbeddings(model_name='all-MiniLM-L6-v2')

创建向量数据库：使用 chromadb 创建向量数据库，并将文本数据嵌入到向量空间中。

from langchain.vectorstores import Chroma# 创建向量数据库
db = Chroma.from_documents(docs, embeddings)

4. 选择和加载大语言模型

选择模型：选择一个适合你需求的开源大语言模型，例如 vicuna、llama 等。可以从 Hugging Face 上下载模型权重。
加载模型：使用 transformers 库加载模型。

from transformers import AutoTokenizer, AutoModelForCausalLM# 加载分词器和模型
tokenizer = AutoTokenizer.from_pretrained('your_model_name')
model = AutoModelForCausalLM.from_pretrained('your_model_name')

5. 构建 RAG 系统

检索器：使用向量数据库创建检索器，用于从数据库中检索与查询相关的文档。

# 创建检索器
retriever = db.as_retriever()

结合检索和生成：使用 langchain 的 RetrievalQA 类将检索和生成过程结合起来。

from langchain.chains import RetrievalQA
from langchain.llms import HuggingFacePipeline
from transformers import pipeline# 创建语言模型管道
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=512
)
llm = HuggingFacePipeline(pipeline=pipe)# 创建 RAG 链
qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=retriever)

6. 测试 RAG 系统

提出问题：使用构建好的 RAG 系统回答用户的问题。

# 提出问题
query = "你的问题是什么？"
result = qa.run(query)
print(result)

注意事项

模型选择：不同的大语言模型在性能和资源需求上有所不同，需要根据实际情况选择合适的模型。
数据质量：数据的质量直接影响 RAG 系统的性能，需要对数据进行充分的预处理和清洗。
资源需求：运行本地 RAG 系统需要一定的计算资源，特别是使用大型语言模型时，可能需要 GPU 加速。
总结

通过上述步骤，您可以轻松在 Windows 环境中构建一个具备企业级性能的私有知识库。整个过程简单快捷，适合个人用户和小型团队使用。希望这些信息对您有所帮助！

查看全文

http://www.dtcms.com/wzjs/330085.html

在哪个网站做问卷好win10系统优化软件

网站做博彩反向代理违法百度地图推广怎么做的

西安的最新疫情情况轨迹百度seo自动优化

一条龙有哪些服务seo优化快速排名

东莞微客巴巴做网站最新推广方法

垂直类网站怎么做百度网址大全旧版

做企业宣传网站公司国家免费技能培训有哪些

刚做淘客没有网站如何制作一个公司网站

公安网站源码游戏推广话术

红色网站建设的作用和意义seo型网站

昆山住房与城乡建设局网站宁波网站推广方式怎么样

ui设计的网站win10必做的优化

邢台哪个公司做网站百度seo快排软件

包牛牛网站怎么做广告发布平台

企业网站建设公司郑州谷歌搜索排名规则

做网站UI工具超八成搜索网站存在信息泄露问题

制作好网站天眼查企业查询

做网站看什么书如何找友情链接

网站建设哪个公司好医院营销策略的具体方法

网站建设经营范围外包公司和劳务派遣的区别

北京网站外包中国软文网

河南省政府采购网上商城百度seo是什么意思呢

中国住房和城乡建设网网站论坛推广的步骤

芜湖网站建设电话网店推广方案策划书

黄冈网站设计推广哪家好怎样注册网站免费注册

不用php做网站app怎么推广

平面广告设计师的工作内容网站seo招聘

vs2010网站开发源码大数据培训班需要多少钱

建设网站创业网站推广优化设计方案

如何给公司做网站推广宣传138ip查询网域名解析