当前位置: 首页 > wzjs >正文

网站制作代理平台下载百度导航最新版本

网站制作代理平台,下载百度导航最新版本,网站标题设计在线,合肥网站建设的价格文章目录 在 Windows 中使用 DeepSeek 和 Milvus 搭建个人知识库环境配置要求部署步骤实战:搭建本地 RAG1. 环境准备2. 数据准备3. 构建向量数据库4. 选择和加载大语言模型5. 构建 RAG 系统6. 测试 RAG 系统注意事项 在 Windows 中使用 DeepSeek 和 Milvus 搭建个人…

文章目录

  • 在 Windows 中使用 DeepSeek 和 Milvus 搭建个人知识库
    • 环境配置要求
    • 部署步骤
    • 实战:搭建本地 RAG
      • 1. 环境准备
      • 2. 数据准备
      • 3. 构建向量数据库
      • 4. 选择和加载大语言模型
      • 5. 构建 RAG 系统
      • 6. 测试 RAG 系统
      • 注意事项

在 Windows 中使用 DeepSeek 和 Milvus 搭建个人知识库

在这里插入图片描述

环境配置要求

操作系统:Windows 10 或更高版本
Docker:安装 Docker Desktop for Windows
Ollama:安装 Ollama 用于模型服务
最低配置:CPU 4核、内存 8G,建议配置:CPU 8核、内存 16G

部署步骤

  1. 安装 Docker Desktop
    访问 Docker 官网 下载并安装 Docker Desktop for Windows。
    启动 Docker Desktop 并确保其正常运行。
  2. 下载并配置 Milvus
    打开命令提示符或 PowerShell,执行以下命令克隆 Milvus 仓库:
git clone https://github.com/milvus-io/milvus.git
cd milvus/deployments/docker-standalone

修改 docker-compose.yml 文件,添加 Milvus 账号密码:

version: '3.5'
services:etcd:container_name: milvus-etcdimage: registry.cn-hangzhou.aliyuncs.com/xy-zy/etcd:v3.5.5environment:- ETCD_AUTO_COMPACTION_MODE=revisionvolumes:- /volumes/etcd:/etcdhealthcheck:test: ["CMD", "etcdctl", "endpoint", "health"]minio:container_name: milvus-minioimage: registry.cn-hangzhou.aliyuncs.com/xy-zy/minio:RELEASE.2023-03-20T20-16-18Zenvironment:MINIO_ROOT_USER: minioadminMINIO_ROOT_PASSWORD: minioadminports:- "9001:9001"- "9000:9000"volumes:- /volumes/minio:/minio_datacommand: minio server /minio_data --console-address ":9001"milvus:container_name: milvus-standaloneimage: registry.cn-hangzhou.aliyuncs.com/xy-zy/milvus:v2.5.4command: ["milvus", "run", "standalone"]security_opt:- seccomp:unconfinedenvironment:ETCD_ENDPOINTS: etcd:2379MINIO_ADDRESS: minio:9000COMMON_USER: milvusCOMMON_PASSWORD: milvusvolumes:- /volumes/milvus:/var/lib/milvus
  1. 启动并检查 Milvus 服务
    在命令提示符或 PowerShell 中,执行以下命令启动 Milvus 服务:
docker-compose up -d

检查服务状态:

docker-compose ps
  1. 注册硅基流动获取 API 密钥
    访问硅基流动官网,注册账号并创建 API 密钥。
    记录 API 密钥,后续配置中需要使用。
  2. 配置 AnythingLLM

1.添加 Milvus 向量数据库

打开 AnythingLLM 界面,选择向量数据库选项。
选择 Milvus,并填入部署好的 Milvus 的地址、用户名、密码并保存。

2.配置 Embedder:

选择 Embedder 首选项,选择 Ollama 并填入部署好的 Ollama 的 URL 和模型名称并保存。

3.上传数据集:

上传区域传入数据集并点击 Move 向量化后存入 Milvus。

实战:搭建本地 RAG

模型服务:通过 API 调用完整版 DeepSeek 模型,而非本地部署精简版。
向量数据库:使用 Milvus 进行高效检索。
应用前端:使用 AnythingLLM 提供的完整 UI 界面,支持多种大型模型接口。
RAG(Retrieval Augmented Generation,检索增强生成)是一种结合了信息检索和大语言模型生成能力的技术。下面为你详细介绍搭建本地 RAG 系统的步骤:

1. 环境准备

  • 安装 Python:确保你的系统中安装了 Python 3.7 或更高版本。可以从 Python 官方网站 下载并安装。
  • 创建虚拟环境:建议使用虚拟环境来管理项目依赖,以避免不同项目之间的冲突。可以使用 venvconda 来创建虚拟环境。
# 使用 venv 创建虚拟环境
python -m venv rag_env
# 激活虚拟环境
source rag_env/bin/activate  # Linux/Mac
.\rag_env\Scripts\activate  # Windows
  • 安装必要的库:主要需要安装 langchainsentence-transformerschromadbtransformers 等库。
pip install langchain sentence-transformers chromadb transformers torch

2. 数据准备

  • 收集数据:收集与你的应用场景相关的文本数据,例如文档、文章、网页等。将这些数据保存为文本文件,或者存储在数据库中。
  • 数据预处理:对收集到的数据进行预处理,包括去除噪声、分词、清洗等操作。可以使用 nltkspaCy 等库来进行文本预处理。
import nltk
nltk.download('punkt')def preprocess_text(text):# 分词tokens = nltk.word_tokenize(text)# 去除标点符号和停用词filtered_tokens = [token for token in tokens if token.isalpha()]# 合并分词结果preprocessed_text = ' '.join(filtered_tokens)return preprocessed_text

3. 构建向量数据库

  • 加载数据:使用 langchain 加载预处理后的文本数据。
from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter# 加载文本数据
loader = TextLoader('your_data.txt')
documents = loader.load()# 文本分割
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(documents)
  • 创建嵌入模型:使用 sentence-transformers 库创建文本嵌入模型。
from langchain.embeddings import HuggingFaceEmbeddings# 创建嵌入模型
embeddings = HuggingFaceEmbeddings(model_name='all-MiniLM-L6-v2')
  • 创建向量数据库:使用 chromadb 创建向量数据库,并将文本数据嵌入到向量空间中。
from langchain.vectorstores import Chroma# 创建向量数据库
db = Chroma.from_documents(docs, embeddings)

4. 选择和加载大语言模型

  • 选择模型:选择一个适合你需求的开源大语言模型,例如 vicunallama 等。可以从 Hugging Face 上下载模型权重。
  • 加载模型:使用 transformers 库加载模型。
from transformers import AutoTokenizer, AutoModelForCausalLM# 加载分词器和模型
tokenizer = AutoTokenizer.from_pretrained('your_model_name')
model = AutoModelForCausalLM.from_pretrained('your_model_name')

5. 构建 RAG 系统

  • 检索器:使用向量数据库创建检索器,用于从数据库中检索与查询相关的文档。
# 创建检索器
retriever = db.as_retriever()
  • 结合检索和生成:使用 langchainRetrievalQA 类将检索和生成过程结合起来。
from langchain.chains import RetrievalQA
from langchain.llms import HuggingFacePipeline
from transformers import pipeline# 创建语言模型管道
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=512
)
llm = HuggingFacePipeline(pipeline=pipe)# 创建 RAG 链
qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=retriever)

6. 测试 RAG 系统

  • 提出问题:使用构建好的 RAG 系统回答用户的问题。
# 提出问题
query = "你的问题是什么?"
result = qa.run(query)
print(result)

注意事项

  • 模型选择:不同的大语言模型在性能和资源需求上有所不同,需要根据实际情况选择合适的模型。
  • 数据质量:数据的质量直接影响 RAG 系统的性能,需要对数据进行充分的预处理和清洗。
  • 资源需求:运行本地 RAG 系统需要一定的计算资源,特别是使用大型语言模型时,可能需要 GPU 加速。
    总结

通过上述步骤,您可以轻松在 Windows 环境中构建一个具备企业级性能的私有知识库。整个过程简单快捷,适合个人用户和小型团队使用。希望这些信息对您有所帮助!

http://www.dtcms.com/wzjs/330085.html

相关文章:

  • 在哪个网站做问卷好win10系统优化软件
  • 网站做博彩反向代理违法百度地图推广怎么做的
  • 西安的最新疫情情况轨迹百度seo自动优化
  • 一条龙 有哪些服务seo优化快速排名
  • 东莞微客巴巴做网站最新推广方法
  • 垂直类网站怎么做百度网址大全旧版
  • 做企业宣传网站公司国家免费技能培训有哪些
  • 刚做淘客没有网站如何制作一个公司网站
  • 公安网站源码游戏推广话术
  • 红色网站建设的作用和意义seo型网站
  • 昆山住房与城乡建设局网站宁波网站推广方式怎么样
  • ui设计的网站win10必做的优化
  • 邢台哪个公司做网站百度seo快排软件
  • 包牛牛网站怎么做广告发布平台
  • 企业网站建设公司郑州谷歌搜索排名规则
  • 做网站UI工具超八成搜索网站存在信息泄露问题
  • 制作好网站天眼查企业查询
  • 做网站看什么书如何找友情链接
  • 网站建设哪个公司好医院营销策略的具体方法
  • 网站建设经营范围外包公司和劳务派遣的区别
  • 北京网站外包中国软文网
  • 河南省政府采购网上商城百度seo是什么意思呢
  • 中国住房和城乡建设网网站论坛推广的步骤
  • 芜湖网站建设电话网店推广方案策划书
  • 黄冈网站设计推广哪家好怎样注册网站免费注册
  • 不用php做网站app怎么推广
  • 平面广告设计师的工作内容网站seo招聘
  • vs2010网站开发源码大数据培训班需要多少钱
  • 建设网站创业网站推广优化设计方案
  • 如何给公司做网站推广宣传138ip查询网域名解析