当前位置: 首页 > wzjs >正文

安徽哪家公司做网站比较好湖南seo优化哪家好

安徽哪家公司做网站比较好,湖南seo优化哪家好,多少钱的英文怎么写,佛山市建网站做网站费用什么是RAG RAG(检索增强生成)是一种将语言模型与可搜索知识库结合的方法,主要包含以下关键步骤: 数据预处理 加载:从不同格式(PDF、Markdown等)中提取文本分块:将长文本分割成短序列(通常100-500个标记),作为检索单元…

什么是RAG

RAG(检索增强生成)是一种将语言模型与可搜索知识库结合的方法,主要包含以下关键步骤:

  1. 数据预处理

    • 加载:从不同格式(PDF、Markdown等)中提取文本
    • 分块:将长文本分割成短序列(通常100-500个标记),作为检索单元
      在这里插入图片描述
  2. 检索系统构建

    • embedding:使用embedding模型为每个文本块生成向量表示
    • 存储:将这些向量索引到向量数据库中
    • 可选-重排:结合关键词搜索构建混合搜索系统,并添加重排序步骤
      在这里插入图片描述
  3. 查询处理流程

    • 接收用户查询并评估其相关性
    • 对查询进行嵌入,在向量库中查找相关块
      在这里插入图片描述
  4. 生成输出

    • 将检索到的相关内容与原始查询一起传递给LLM
    • LLM根据这些上下文信息生成更准确、更符合事实的回答
      在这里插入图片描述

RAG的核心价值在于通过非参数数据源为模型提供正确、具体且最新的信息,从而改进传统LLM的回答质量。

RAG vs 超长上下文

随着模型如Claude、GPT-4和Gemini 1.5等能够处理高达100万tokens甚至200万tokens的输入,业界开始思考一个关键问题:在如此长的上下文支持下,我们未来是否还需要检索增强生成(RAG)技术。

下表将会对比RAG与超长文本优缺点

特点超长上下文RAG技术实际影响
成本⚠️ 高✅ 低200万tokens API调用vs.数千tokens
安全性⚠️ 全部暴露✅ 按需暴露敏感信息保护程度
检索精度⚠️ 随文档长度降低,AI对更近的文本记忆力更好✅ 相对稳定问答准确率差异
容量限制⚠️ 有上限(~200万tokens)✅ 基本无限可处理知识库规模

RAG综合实操

由于本系列已经提到有关RAG的各个细节理论与代码,因此这里有些细节不再重复。

RAG入门篇

环境准备
本机Ollama需要下载了模型ollama run deepseek-r1:7b

# 安装必要依赖
pip install langchain langchain-community chromadb  beautifulsoup4  sentence-transformers langchain-ollama

一个RAG分为一下5个部分

  1. 加载: 通过 document_loaders 完成数据加载
  2. 分割: text_splitter 将大型文档分割成更小的块,便于索引和模型处理
  3. 存储: 使用 vectorstores embeddings 模型存储和索引分割的内容
  4. 检索: 使用 RetrievalQA 基于用户输入,使用检索器从存储中检索相关分割
  5. 生成: llms 使用包含问题和检索数据的提示生成答案
from langchain.document_loaders import WebBaseLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.vectorstores import Chroma
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate
from langchain.llms import Ollama
import os
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'loader = WebBaseLoader("https://blog.csdn.net/ngadminq/article/details/147687050")
documents = loader.load()text_splitter = RecursiveCharacterTextSplitter(chunk_size=500,chunk_overlap=50
)
chunks = text_splitter.split_documents(documents)embedding_model = HuggingFaceEmbeddings(model_name="BAAI/bge-small-zh"
)vectorstore = Chroma.from_documents(documents=chunks,embedding=embedding_model,persist_directory="./chroma_db"
)# 创建检索器
retriever = vectorstore.as_retriever()template = """
根据以下已知信息,简洁并专业地回答用户问题。
如果无法从中得到答案,请说"我无法从已知信息中找到答案"。已知信息:
{context}用户问题:{question}回答:
"""
prompt = PromptTemplate(template=template,input_variables=["context", "question"]
)#
llm = Ollama(model="deepseek-r1:7b")  # 本地部署的模型qa_chain = RetrievalQA.from_chain_type(llm=llm,chain_type="stuff",retriever=retriever,chain_type_kwargs={"prompt": prompt}
)question = "图灵的论文叫什么?"
result = qa_chain.invoke({"query": question})
print(result["result"])

在这里插入图片描述


文章转载自:

http://1tm2kbsH.qphcq.cn
http://9lZliFuA.qphcq.cn
http://wloHza4t.qphcq.cn
http://nMCCD5Cv.qphcq.cn
http://pAbrAiaj.qphcq.cn
http://Z1e8hmA0.qphcq.cn
http://mtIMhoaF.qphcq.cn
http://zwaRF8jD.qphcq.cn
http://EZWgxlBu.qphcq.cn
http://VFXSoTNo.qphcq.cn
http://9tTxpAPN.qphcq.cn
http://7kvU1L7v.qphcq.cn
http://uqEgS01V.qphcq.cn
http://Sx97gVpx.qphcq.cn
http://ct4EaQFG.qphcq.cn
http://zqZmFPkZ.qphcq.cn
http://VzftnyOC.qphcq.cn
http://P7H7ILlM.qphcq.cn
http://tKVzcjAB.qphcq.cn
http://I5fQwsKJ.qphcq.cn
http://AZWqmSVq.qphcq.cn
http://7BBlzlCB.qphcq.cn
http://0fMmH1a0.qphcq.cn
http://I6KsD5jY.qphcq.cn
http://zI5xLjgG.qphcq.cn
http://VwBCshT5.qphcq.cn
http://HO0EdDni.qphcq.cn
http://hFE4KpWR.qphcq.cn
http://An2EfuHR.qphcq.cn
http://sOPE5PNc.qphcq.cn
http://www.dtcms.com/wzjs/623653.html

相关文章:

  • 怎么用动图做网站背景微信公众号怎么搞
  • 网站需求报告怎么写黄页88网推广服务免费
  • 大型网站的制作渭南网站建设风尚网络
  • 手机免费网站建设哪家公司好电话销售怎么找客户渠道
  • 巢湖市重点工程建设管理局网站建设厅网站
  • 设计素材网站永久办公空间设计论文
  • 盐城网站优化推广服务seo需要掌握什么技能
  • 家居网站建设公司广州公司关键词网络推广
  • 中国建筑文兵简历aso优化违法吗
  • 建设俄语网站哪里做网站做的好
  • 文化公司网站建设湖南建设厅网站不良记录
  • 做国外有那些网站比较好即墨今天新闻大事
  • 网站免费域名申请wordpress傻瓜建站教程
  • 景安网站备案 不去拍照洛阳网站设计哪家专业
  • 杭州微信网站制作前端面试题2022
  • 自己做的旅游网站简介校友网站建设的意义
  • 网站建设与维护 目录app直播源码
  • 论坛申请网站备案前置审批php网站好处
  • 企业网站建设排名价格做网站推广员图片处理问题
  • 学校网站风格网站设计提成多少钱
  • 做平面常用的网站设计工作室官网
  • 建筑效果图素材网站怎么让做的网站赚钱吗
  • 网站开发的调研内容网站欢迎页面 特效
  • 泸州网站开发公司wordpress+4.0+简体中文
  • 企业做网站的优势百度关键词优化多少钱一年
  • 达内网站开发学习培训常州模板网站建设
  • 兰州百度公司网站建设重庆合川企业网站建设联系电话
  • 网站如何做微信支付宝支付wordpress类目权限
  • 整站优化要多少钱深圳网站建设选哪家
  • 做网站开发的方案职业生涯规划ppt免费模板