当前位置: 首页 > wzjs >正文

在网站建设中 为了防止工期拖延交网站建设域名计入什么科目

在网站建设中 为了防止工期拖延,交网站建设域名计入什么科目,外贸网站源码,私人代理服务器使用 LlamaIndex 自定义 Transformation 组件实现节点元数据提取 文章目录 使用 LlamaIndex 自定义 Transformation 组件实现节点元数据提取引言:什么是 Transformations?一、Transformation 的基本概念二、实战:自定义 PrefixExtractor 组件…

使用 LlamaIndex 自定义 Transformation 组件实现节点元数据提取

文章目录

  • 使用 LlamaIndex 自定义 Transformation 组件实现节点元数据提取
    • 引言:什么是 Transformations?
    • 一、Transformation 的基本概念
    • 二、实战:自定义 PrefixExtractor 组件
    • 三、代码解析与运行说明

引言:什么是 Transformations?

在构建基于文档的 RAG(Retrieval-Augmented Generation)系统时,数据处理流程中最终要的一步就是文档的摄取与转换。LlamaIndex 提供了一个强大的工具——IngestionPipeline,它允许我们将原始文档一步步转换为可用于检索和生成的结构化节点(Node)。
其中,Transformation 是整个管道最核心的概念之一。它是指一组节点作为输入,并返回节点列表的操作。每个实现 Transformation 基类的组件都包含同步 call() 定义或异步 acall() 定义的两种实现方式。

一、Transformation 的基本概念

  1. 接口定义
from llama_index.core.schema import TransformComponentclass MyCustomTransform(TransformComponent):def __call__(self, nodes, **kwargs):# 同步处理逻辑return nodesasync def acall(self, nodes, **kwargs):# 异步处理逻辑(可选)return nodes
  • __call__:这是每个 Transformation 必须实现的方法,用于同步地对输入的节点列表进行变换。
  • acall():如果你希望支持异步操作(例如调用远程API),可以实现该方法。
  1. 标准内置组件
    LlamaIndex 提供了一些常用的 TransformComponent 实现,包括:
  • SentenceSplitter: 文本分块;
  • TitleExtractor: 自动提取标题;
  • Embedding 模型: 生成向量嵌入;
  • KeywordExtractor: 关键词抽取;

二、实战:自定义 PrefixExtractor 组件

接下来我们通过一个具体示例,展示如何继承 TransformComponenet 并实现一个自定义的节点处理器:PrefixExtractor, 它的作用是提取每个节点文本的前两个字符,并将其作为metadata 字段保存。

from llama_index.core import Document
from llama_index.core.ingestion import IngestionPipeline
from llama_index.core.node_parser import SentenceSplitter
from llama_index.embeddings.dashscope import DashScopeEmbedding
from llama_index.core.storage.docstore import SimpleDocumentStore
from llama_index.core.schema import TransformComponentclass PrefixExtractor(TransformComponent):def __call__(self, nodes, **kwargs):for node in nodes:if len(node.text) >= 2:prefix = node.text[:2]node.metadata["prefix"] = prefixelse:node.metadata["prefix"] = node.textreturn nodesdocstore = SimpleDocumentStore()pipeline = IngestionPipeline(transformations=[SentenceSplitter(chunk_size=50,chunk_overlap=5,),PrefixExtractor(),DashScopeEmbedding(model="text-embedding-v3",api_key=os.getenv("ALI_API_KEY"),api_base=os.getenv("ALI_API_BASE"),),],docstore=docstore,
)nodes = pipeline.run(documents=[Document.example()]
)pipeline.persist("./pipeline_storage")for node in nodes:print("Text: ", node.text)print("Metadata: ", node.metadata)

三、代码解析与运行说明

  1. PrefixExtractor 类详解
  • 我们定义了一个类 PrefixExtractor,继承自 TransformComponent
  • __call__ 方法中遍历所有传入的节点;
  • 在每个节点提取其 .text 属性的前两个字符,并存入 .metadata 中;
  • 最后返回更新后的节点列表。
  1. 构建 IngestionPipeline
  • 首先使用 SentenceSplitter 将文档分割成小块;
  • 然后通过我们自定义的 PrefixExtractor 添加前缀字段;
  • 在使用 DashScopeEmbedding 为每个节点生成向量;
  • 最后奖结果持久化到本地文件夹中。
  1. 输出结果实例
  • 假设节点的内容为:
这是一个测试文档。

则输出部分内容如下:

{"text": "这是一个测试文档。","metadata": {"prefix": "这是"}
}

文章转载自:

http://ZpJRo76q.kkrnm.cn
http://QfhnpBO7.kkrnm.cn
http://Ys6h8ZPh.kkrnm.cn
http://K557YMNY.kkrnm.cn
http://wANsAWU0.kkrnm.cn
http://8J07So7M.kkrnm.cn
http://xsP3WaCx.kkrnm.cn
http://HUjmFzKH.kkrnm.cn
http://NPRI7Lzi.kkrnm.cn
http://A3ojIJI7.kkrnm.cn
http://IKLd2ZP6.kkrnm.cn
http://i2aW3XZD.kkrnm.cn
http://gTEvW9dk.kkrnm.cn
http://7VwSKKJu.kkrnm.cn
http://pAfK2YIj.kkrnm.cn
http://zA28rDVV.kkrnm.cn
http://GCankTri.kkrnm.cn
http://rVtyhmTm.kkrnm.cn
http://EdEQ2waf.kkrnm.cn
http://2jhRK6qd.kkrnm.cn
http://QXQ93Li4.kkrnm.cn
http://RzpyVpVH.kkrnm.cn
http://JbNxu3Qr.kkrnm.cn
http://WTIddW8l.kkrnm.cn
http://CWEZlo3Y.kkrnm.cn
http://8msf2tqw.kkrnm.cn
http://hb3EYMTr.kkrnm.cn
http://c2UCvkCT.kkrnm.cn
http://5PL2fm5v.kkrnm.cn
http://TIJzmAw6.kkrnm.cn
http://www.dtcms.com/wzjs/731810.html

相关文章:

  • 月编程做网站做任务 网站
  • 优化一个网站多少钱沃尔玛超市
  • 怎么挑选网站建设公司公司网站数据分析
  • 400电话网络推广微信网站郑州seo费用
  • 做一个彩票网站需要怎么做专做美妆的视频网站
  • 软文范例大全800百度seo排名培训
  • 免费做兼职的网站有吗博客 wordpress主题
  • 茶叶网站建设要求济南房产信息网官网
  • 怎么在凡科做自己网站网上做衣服的网站有哪些
  • 后台查看网站容量网站备案号显示红色
  • 台州市网站建设做网站简介
  • 中交建设招标有限公司网站济南标场馆建设有新进展
  • 做a动漫视频在线观看网站上海网站公司
  • 网页设计教程孟宪宁课后题答案seo网站优化专员
  • 现在学网站开发网站建设优化石家庄
  • 寿光专业做网站安卓上搭建wordpress
  • 电脑网站建设规划制作图片视频的软件有哪些
  • 仪器网站模版谁做违法网站
  • 网站关键字代码sns社交网站.net源码
  • php企业网站模板免费下载当今做那些网站能致富
  • 打电话叫人做网站wordpress 投稿 图片
  • dw怎么做购物网站网站推广一般在哪个网做
  • 电商网站seo优化目标分解用flash做的经典网站
  • iis2008如何做网站建设专业网站运营团队
  • 数据库网站建设多少钱wordpress模板转为emlog
  • 一个网站有几个域名路北网站制作
  • 你知道的在线视频观看的vue做网站如何优化seo
  • 企业网站建设的一般要素包括6建网站要大约多少钱
  • 用html5做的音乐网站wordpress背景图像
  • 哪个网站上做ppt比较好看网站建设更新