当前位置: 首页 > wzjs >正文

杭州seo全网营销西安seo招聘

杭州seo全网营销,西安seo招聘,石家庄网站建设推广,wordpress front end文档加载(Document Loading):从多种不同来源加载文档。LangChain提供了100多种不同的文档加载器,包括PDF在内的非结构化的数据、SQL在内的结构化的数据,以及Python、Java之类的代码等​ •文本分割(Splitti…

在这里插入图片描述

  • 文档加载(Document Loading):从多种不同来源加载文档。LangChain提供了100多种不同的文档加载器,包括PDF在内的非结构化的数据、SQL在内的结构化的数据,以及Python、Java之类的代码等​ •
  • 文本分割(Splitting):文本分割器把Documents 切分为指定大小的块,我把它们称为“文档块”或者“文档片”​
  • 存储(Storage):存储涉及到两个环节,分别是:​
    ◦ 将切分好的文档块进行嵌入(Embedding)转换成向量的形式​
    ◦ 将Embedding后的向量数据存储到向量数据库​
  • 检索(Retrieval):一旦数据进入向量数据库,我们仍然需要将数据检索出来,我们会通过某种检索算法找到与输入问题相似的嵌入片​
  • Output(输出):把问题以及检索出来的嵌入片一起提交给LLM,LLM会通过问题和检索出来的提示一起来生成更加合理的答案

文本加载器(Document Loaders)​

文本加载器就是将用户提供的文本加载到内存中,便于进行后续的处理​ ​

文本切割器(Text Splitters)​

文本分割器把Documents 切分为指定大小的块,我把它们称为“文档块”或者“文档片”​ 文本切割通常有以下几个原因​
• 为了更好的进行文本嵌入以及向量数据库的存储​
• 通常大语言模型都有上下文的限制,如果不进行切割,文本在传递给大模型的时候可能超出上下文限制导致大模型随机丢失信息​

文本切割器的概念是非常容易理解的,这里我们简单了解下文本切割器的工作流程​

  1. 将文本切割成小的,语义上有意义的块(通常是句子)​
  2. 开始将这些小块组成一个较大的块,直到达到某个块的大小(这个会通过某种函数测量)​
  3. 一旦达到该大小,就将该块作为自己的文本片段,并开始创建一个新的文本块,同时保留一些重叠(以保持块之间的上下文)。​ ​

文本嵌入模型(Text Embedding models)​

文本嵌入模型是用来将文本转换成数值向量的工具,这些向量能够捕捉文本的语义信息,使得相似的文本在向量空间中彼此接近。这对于各种自然语言处理任务,如文本相似性比较、聚类和检索等,都是非常有用的。下面是一段对嵌入的解释

在这里插入图片描述
在这里插入图片描述

文本检索​

一旦数据进入向量数据库,我们仍然需要将数据检索出来,我们会通过某种检索算法找到与输入问题相似的嵌入片。这里主要利用了大模型的能力

AnythingLLM 本地安装、配置

  1. 选择大模型
    在这里插入图片描述
  2. 选择文本嵌入模型
    在这里插入图片描述
  3. 选择向量数据库
    在这里插入图片描述

构建本地知识库

AnythingLLM中有一个Workspace的概念,我们可以创建自己独有的Workspace跟其他的项目数据进行隔离。

  1. 首先创建一个工作空间
    在这里插入图片描述
  2. 上传文档并且在工作空间中进行文本嵌入

在这里插入图片描述
3. 选择对话模式​
AnythingLLM提供了两种对话模式:​

  • Chat模式:大模型会根据自己的训练数据和我们上传的文档数据综合给出答案​
  • Query模式:大模型仅仅会依靠文档中的数据给出答案
    在这里插入图片描述
  1. 测试对话​
    当上述配置完成之后,我们就可以跟大模型进行对话了
    在这里插入图片描述
http://www.dtcms.com/wzjs/405288.html

相关文章:

  • 网页设计素材网站花化妆品软文推广范文
  • 工程承包网站哪个好?什么是软文文案
  • 建设部网站注册查询广州seo网站公司
  • 学校校园网站建设方案网络推广用什么软件好
  • 手机网站带后台源代码网络营销策划的基本原则
  • 哪里卖网站模板怎么在网上推广广告
  • 医院网站 功能宁波seo教学
  • 网站建设优点网络营销研究现状文献综述
  • asp动态网站开发考试seo论坛
  • 软件最全的网站seo优化公司如何做
  • 佛山网站建设服务公司如何进行app推广
  • 网站建设的发票怎么做会计分录八戒
  • 拉萨伟志达网站建设免费网站推广网址
  • 加工钢球网架公司二十条优化措施
  • 男女性做那个视频网站seo综合查询工具下载
  • 九江网站建设哪家公司好深圳十大教育培训机构排名
  • 广州哪个公司做网站好合肥seo管理
  • 模板网站建设公司优化网站排名工具
  • 旅游网站建设案例分析个人博客seo
  • 北京网站建设价钱市场推广
  • 成全视频高清免费观看好听的歌seo网络营销案例分析
  • 如何做平台网站外贸互联网推广的
  • 有没有跟一起做网店一样的网站google官网注册
  • 人民日报客户端官方网湖南优化公司
  • 做头像一个字的网站国外域名注册平台
  • 抚州做网站seo每日工作内容
  • 有什么网站有小学生做的题目希爱力双效片的作用与功效
  • 无锡崇安网站建设10条重大新闻
  • 做什爱网站2022好用值得推荐的搜索引擎
  • 最准做特马网站免费网站seo排名优化