当前位置：首页 > wzjs >正文

在家做客服的平台外贸网站优化推广

wzjs 2025/7/22 21:13:55

在家做客服的平台,外贸网站优化推广,wordpress 文章搜集,做类似美团的网站得多少钱文章目录在 Windows 中使用 DeepSeek 和 Milvus 搭建个人知识库环境配置要求部署步骤实战：搭建本地 RAG1. 环境准备2. 数据准备3. 构建向量数据库4. 选择和加载大语言模型5. 构建 RAG 系统6. 测试 RAG 系统注意事项在 Windows 中使用 DeepSeek 和 Milvus 搭建个人…

文章目录

在 Windows 中使用 DeepSeek 和 Milvus 搭建个人知识库
- 环境配置要求
- 部署步骤
- 实战：搭建本地 RAG
- - 1. 环境准备
  - 2. 数据准备
  - 3. 构建向量数据库
  - 4. 选择和加载大语言模型
  - 5. 构建 RAG 系统
  - 6. 测试 RAG 系统
  - 注意事项

在 Windows 中使用 DeepSeek 和 Milvus 搭建个人知识库

在这里插入图片描述

环境配置要求

操作系统：Windows 10 或更高版本
Docker：安装 Docker Desktop for Windows
Ollama：安装 Ollama 用于模型服务
最低配置：CPU 4核、内存 8G，建议配置：CPU 8核、内存 16G

部署步骤

安装 Docker Desktop
访问 Docker 官网下载并安装 Docker Desktop for Windows。
启动 Docker Desktop 并确保其正常运行。
下载并配置 Milvus
打开命令提示符或 PowerShell，执行以下命令克隆 Milvus 仓库：

git clone https://github.com/milvus-io/milvus.git
cd milvus/deployments/docker-standalone

修改 docker-compose.yml 文件，添加 Milvus 账号密码：

version: '3.5'
services:etcd:container_name: milvus-etcdimage: registry.cn-hangzhou.aliyuncs.com/xy-zy/etcd:v3.5.5environment:- ETCD_AUTO_COMPACTION_MODE=revisionvolumes:- /volumes/etcd:/etcdhealthcheck:test: ["CMD", "etcdctl", "endpoint", "health"]minio:container_name: milvus-minioimage: registry.cn-hangzhou.aliyuncs.com/xy-zy/minio:RELEASE.2023-03-20T20-16-18Zenvironment:MINIO_ROOT_USER: minioadminMINIO_ROOT_PASSWORD: minioadminports:- "9001:9001"- "9000:9000"volumes:- /volumes/minio:/minio_datacommand: minio server /minio_data --console-address ":9001"milvus:container_name: milvus-standaloneimage: registry.cn-hangzhou.aliyuncs.com/xy-zy/milvus:v2.5.4command: ["milvus", "run", "standalone"]security_opt:- seccomp:unconfinedenvironment:ETCD_ENDPOINTS: etcd:2379MINIO_ADDRESS: minio:9000COMMON_USER: milvusCOMMON_PASSWORD: milvusvolumes:- /volumes/milvus:/var/lib/milvus

启动并检查 Milvus 服务
在命令提示符或 PowerShell 中，执行以下命令启动 Milvus 服务：

docker-compose up -d

检查服务状态：

docker-compose ps

注册硅基流动获取 API 密钥
访问硅基流动官网，注册账号并创建 API 密钥。
记录 API 密钥，后续配置中需要使用。
配置 AnythingLLM

1.添加 Milvus 向量数据库：

打开 AnythingLLM 界面，选择向量数据库选项。
选择 Milvus，并填入部署好的 Milvus 的地址、用户名、密码并保存。

2.配置 Embedder：

选择 Embedder 首选项，选择 Ollama 并填入部署好的 Ollama 的 URL 和模型名称并保存。

3.上传数据集：

上传区域传入数据集并点击 Move 向量化后存入 Milvus。

实战：搭建本地 RAG

模型服务：通过 API 调用完整版 DeepSeek 模型，而非本地部署精简版。
向量数据库：使用 Milvus 进行高效检索。
应用前端：使用 AnythingLLM 提供的完整 UI 界面，支持多种大型模型接口。
RAG（Retrieval Augmented Generation，检索增强生成）是一种结合了信息检索和大语言模型生成能力的技术。下面为你详细介绍搭建本地 RAG 系统的步骤：

1. 环境准备

安装 Python：确保你的系统中安装了 Python 3.7 或更高版本。可以从 Python 官方网站下载并安装。
创建虚拟环境：建议使用虚拟环境来管理项目依赖，以避免不同项目之间的冲突。可以使用 venv 或 conda 来创建虚拟环境。

# 使用 venv 创建虚拟环境
python -m venv rag_env
# 激活虚拟环境
source rag_env/bin/activate  # Linux/Mac
.\rag_env\Scripts\activate  # Windows

安装必要的库：主要需要安装 langchain、sentence-transformers、chromadb、transformers 等库。

pip install langchain sentence-transformers chromadb transformers torch

2. 数据准备

收集数据：收集与你的应用场景相关的文本数据，例如文档、文章、网页等。将这些数据保存为文本文件，或者存储在数据库中。
数据预处理：对收集到的数据进行预处理，包括去除噪声、分词、清洗等操作。可以使用 nltk、spaCy 等库来进行文本预处理。

import nltk
nltk.download('punkt')def preprocess_text(text):# 分词tokens = nltk.word_tokenize(text)# 去除标点符号和停用词filtered_tokens = [token for token in tokens if token.isalpha()]# 合并分词结果preprocessed_text = ' '.join(filtered_tokens)return preprocessed_text

3. 构建向量数据库

加载数据：使用 langchain 加载预处理后的文本数据。

from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter# 加载文本数据
loader = TextLoader('your_data.txt')
documents = loader.load()# 文本分割
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

创建嵌入模型：使用 sentence-transformers 库创建文本嵌入模型。

from langchain.embeddings import HuggingFaceEmbeddings# 创建嵌入模型
embeddings = HuggingFaceEmbeddings(model_name='all-MiniLM-L6-v2')

创建向量数据库：使用 chromadb 创建向量数据库，并将文本数据嵌入到向量空间中。

from langchain.vectorstores import Chroma# 创建向量数据库
db = Chroma.from_documents(docs, embeddings)

4. 选择和加载大语言模型

选择模型：选择一个适合你需求的开源大语言模型，例如 vicuna、llama 等。可以从 Hugging Face 上下载模型权重。
加载模型：使用 transformers 库加载模型。

from transformers import AutoTokenizer, AutoModelForCausalLM# 加载分词器和模型
tokenizer = AutoTokenizer.from_pretrained('your_model_name')
model = AutoModelForCausalLM.from_pretrained('your_model_name')

5. 构建 RAG 系统

检索器：使用向量数据库创建检索器，用于从数据库中检索与查询相关的文档。

# 创建检索器
retriever = db.as_retriever()

结合检索和生成：使用 langchain 的 RetrievalQA 类将检索和生成过程结合起来。

from langchain.chains import RetrievalQA
from langchain.llms import HuggingFacePipeline
from transformers import pipeline# 创建语言模型管道
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=512
)
llm = HuggingFacePipeline(pipeline=pipe)# 创建 RAG 链
qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=retriever)

6. 测试 RAG 系统

提出问题：使用构建好的 RAG 系统回答用户的问题。

# 提出问题
query = "你的问题是什么？"
result = qa.run(query)
print(result)

注意事项

模型选择：不同的大语言模型在性能和资源需求上有所不同，需要根据实际情况选择合适的模型。
数据质量：数据的质量直接影响 RAG 系统的性能，需要对数据进行充分的预处理和清洗。
资源需求：运行本地 RAG 系统需要一定的计算资源，特别是使用大型语言模型时，可能需要 GPU 加速。
总结

通过上述步骤，您可以轻松在 Windows 环境中构建一个具备企业级性能的私有知识库。整个过程简单快捷，适合个人用户和小型团队使用。希望这些信息对您有所帮助！

查看全文

http://www.dtcms.com/wzjs/54241.html

饿了么网站做要多少钱可以推广的软件有哪些

站长之家 wordpress 流量统计免费创建属于自己的网站

河南龙王建设集团网站刷外链网站

河南建设教育协会网站刷关键词优化排名

手机网站建设方案浏览器正能量网站免费

温州网站优化排名seo效果最好的是

做好网站建设和运营seo百度贴吧

个人网站设计成首页官方app下载安装

做搜狗pc网站快速排app投放推广

石家庄网站建设多少钱爱站网爱情电影网

张家港建网站价格网上推广app怎么做

网站开发主流长尾关键词搜索网站

discu论坛网站模板网站seo诊断分析

百度网站关键词排名查询河南seo关键词排名优化

php网站后台上传不了图片青岛百度快速优化排名

做原材料供应的网站有哪些商城小程序

网站日历插件一站式网站建设

域名网站如何做市场推广技师培训

推广技术合肥seo网站管理

遵义建设厅网站官网株洲企业seo优化

wordpress文章备份清理郭生b如何优化网站

搜公司名字搜不到公司网站视频专用客户端app

wordpress特色图像地址北京seo公司网站

网站建设课程厦门seo优

万网的怎么做网站地图网络推广的基本渠道

苏州手机网站建设多少钱如何找友情链接

秦皇岛营销式网站制作外贸企业网站推广

目录网站做外链福州seo推广优化

搭建网站免费推广拉新app哪几个靠谱

站长工具高清有吗服务营销的七个要素