当前位置: 首页 > wzjs >正文

腾讯云wordpress教程视频seo网站推广软件

腾讯云wordpress教程视频,seo网站推广软件,合肥网站运营,个人申请微信小程序收费吗闲来无事,想研究一下RAG的实现流程,看网上用langchain的比较多,我自己在下面也跑了跑,代码很简单,以次博客记录一下,方便回顾 langchain LangChain 是一个基于大型语言模型(LLM)开发…

闲来无事,想研究一下RAG的实现流程,看网上用langchain的比较多,我自己在下面也跑了跑,代码很简单,以次博客记录一下,方便回顾

langchain

LangChain 是一个基于大型语言模型(LLM)开发应用程序的框架。LangChain 简化了LLM应用程序生命周期的每个阶段。

比如,在下面的实现中,LangChain可以将LLM提示词模板检索器组合在一起快速的完成检索增强整个流程,而不需要你去关心底层具体是怎么实现的。

代码demo

实现思路:

  1. 加载文档,并对文档进行切分
  2. 将切分后的文档转化为向量,存储到向量库中
  3. 根据用户query去向量库中检索,找到最相关的回复,并拼接到prompt中
  4. 根据最新的prompt调用大模型产生增强回复

加载文档 -> 切分文档 -> 创建向量数据库 -> 执行相似度搜索 -> 构建并增强 prompt -> 使用模型生成回答

import os
from openai import OpenAI
import requests
from langchain.text_splitter import CharacterTextSplitter
from weaviate.embedded import EmbeddedOptions
from langchain.prompts import ChatPromptTemplate
from langchain.schema.runnable import RunnablePassthrough
from langchain.schema.output_parser import StrOutputParserfrom langchain_community.document_loaders import TextLoader
from langchain_community.chat_models import ChatOpenAI
from langchain_community.vectorstores import Chroma
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain.schema import Document
from langchain_core.messages import HumanMessage, SystemMessage"""
实现一
"""
def method_one(vectorstore,llm,query):# 根据用户query进行检索,并将检索结果拼接到prompt中def augment_prompt(query: str):# 获取top2的文本片段results = vectorstore.similarity_search(query, k=1)source_knowledge = "\n\n".join([x.page_content for x in results])# 构建promptaugmented_prompt = f"""你叫david,你需要解答xxx问题###参考样例###{source_knowledge}"""return augmented_promptprompt=augment_prompt(query)print(prompt)# 封装输入messages = [SystemMessage(content=prompt),HumanMessage(content=query),]# 生成检索增强回复res = llm.invoke(messages)return res.content"""
实现二
"""
def method_two(vectorstore,llm,query):# 将 vectorstore 转换为一个检索器retriever = vectorstore.as_retriever()# 定义提示模板template = """你叫david,你需要解答xxx问题###参考样例###{context}###用户问题###{question}"""prompt = ChatPromptTemplate.from_template(template)print(prompt)# LangChain 提供了一个高度模块化和可组合的框架就是链,使得你可以根据任务的特性自定义每个组件,并将它们按需组合成执行流程# 定义一个执行流程链,包含如下组件# {"context": retriever,  "question": RunnablePassthrough()}:用来将上下文(通过检索器获得)和用户问题传递给后续组件# prompt里面的占位符与上述定义的context和question是要保持一致的# StrOutputParser():该组件用于解析模型的输出,将其转换为字符串格式rag_chain = ({"context": retriever,  "question": RunnablePassthrough()}| prompt| llm| StrOutputParser())response = rag_chain.invoke(query)return responseif __name__=="__main__":# 加载单个文档,这里只需要匹配单个文档里面的片段path="../rag/faq.txt"loader = TextLoader(path)documents = loader.load()# 如果需要加载多个文档,将上述path改为跟路径即可,然后通过下述两行代码对多个文档进行切分# text_splitter = CharacterTextSplitter()# doc = text_splitter.split_documents(documents)# 切分文档,给定的文档内容主要是通过换行符分隔的text = documents[0].page_contentchunks = [Document(page_content=chunk) for chunk in text.split("\n\n\n") if chunk.strip()]#  将文档片段转化为向量,并存储到 # Chroma 是一个 开源的向量数据库,用于存储和检索向量嵌入model_name = "../model/bge-base-zh-v1.5"embedding = HuggingFaceEmbeddings(model_name=model_name)vectorstore_hf = Chroma.from_documents(documents=chunks, embedding=embedding , collection_name="huggingface_embed")vectorstore = Chroma.from_documents(chunks, embedding)# 初始化对话模型llm = ChatOpenAI(openai_api_key="",openai_api_base="",model='qwen-max')# 用户queryquery = "今天天气如何?"# 检索增强之后的回答enhanced_result=method_one(vectorstore,llm,query)# enhanced_result=method_two(vectorstore,llm,query)print(enhanced_result)

思考

  • 在尝试中发现,文档的嵌入模型选择对匹配结果也影响很大
  • 文档越规范越好切(不同的切分规则对检索和增强都有影响)
http://www.dtcms.com/wzjs/135909.html

相关文章:

  • 黑链 对网站的影响提高搜索引擎检索效果的方法
  • asp.net 怎么做网站seo关键词排名优化哪家好
  • 做网站配置色盲测试图及答案大全
  • 吐鲁番市建设局网站鸣蝉智能建站
  • wordpress改成英文济南seo的排名优化
  • 网站demo怎么做个人网站网址
  • 建设网站的公司网站交易网
  • 专业的常州做网站镇江关键字优化品牌
  • 合肥专业网站建设企业管理
  • 免费网站100m微信营销平台有哪些
  • 安装师傅最好的接单平台网站优化怎么操作
  • 电子商务网站名称和网址天津seo排名效果好
  • wordpress2017网站怎样优化seo
  • 深圳 汽车网站建设有源码怎么搭建网站
  • 如何去除网站外链创建网站免费注册
  • wordpress尾部怎么改江苏网站seo设计
  • 网站微信建设运维经验网络推广免费平台
  • 发视频的网址网址是什么?信息流优化师是什么
  • 哈尔滨网络建站的公司免费发seo外链平台
  • 网站添加微信优化大师下载
  • 网站输入字符 显示出来怎么做国外b站不收费免费2023
  • 攻击网站的方法关键词权重
  • 滁州网站开发czesou2023必考十大时政热点
  • 南宁网站建设团队hs网站推广
  • 一起做网店网站特点石家庄seo代理商
  • 电子商务网站建设的平台湖南企业网站建设
  • 广州番禺网站公司哪家好北京网站排名推广
  • 怎么把自己的网站放到百度上昆明seo网站管理
  • 爱情动做电影网站推荐陕西新闻今日头条
  • 选择邯郸网站制作百度小说排行榜风云榜