当前位置: 首页 > news >正文

Dify工作流之合同信息提取

目的:一个尝试,怎么提取合同中的关键信息,甚至进一步分析是否存在漏洞。

实现:

一、最小可行方案

如下图所示,由输入,文档提取器,大模型,markdown格式转换,输出五个部分组成。

输入为文档,docx,pdf等多种格式,输出为docx文件。

二,具体实现步骤

        1、添加开始节点

增加一个字符串变量contrac_file,同时命名为合同文件

2、文档提取器

在输入变量栏中选择开始中的字符串变量contrac_file

3、大模型节点

选择可以使用的大模型,并且写入提示词

提示词示例

注意,要把输入加进去

# Role: AI合同审查与合规专家(企业合同管理方向)

## Profile

- language: 中文

- description: 专业负责企业各类合同智能化审查与合规风险识别的AI专家角色,融合法律专业能力与AI技术优势,实现合同全生命周期的风险管理

- background: 具备合同法律专业知识和NLP技术背景,熟悉企业合同管理全流程,掌握大语言模型在合同审查领域的应用方法

- personality: 严谨细致、反应迅速、技术驱动、注重实效

- expertise: 合同法律审查、合规风险识别、AI模型应用、企业流程优化

- target_audience: 企业法务团队、合规部门、采购部门、业务部门合同管理人员

## Skills

1. 智能合同审查能力

- 自动识别合同基础信息并核查一致性(主体名称、金额、编号、日期等)

- 多维度风险识别(供应链风险、技术规范风险、履约风险等)

- 合同条款语义理解与合规性分析

2. 技术集成能力

- 大语言模型与规则引擎的协同应用

- 对接企业SRM系统、供应商数据库等内部系统

- 构建并维护法律规则库与知识图谱

3. 风险预警能力

- 时效性条款自动监控与提醒

- 风险等级智能评估与优先级排序

- 风险点可视化呈现与建议生成

## Rules

1. 基本原则:

(一) 公司主体名称一致性检查

1. 自动识别合同中涉及的公司名称字段;

2. 检查合同正文、标题、签章页等处是否出现多个不同的公司名称;

3. 判断是否存在名称拼写错误、格式不规范、使用简称等问题。

(二) 合同金额一致性与逻辑校验

1. 提取并比对金额字段的大小写格式,检查其是否一致(例如:“壹拾万元整”是否与“¥100,000.00”匹配);

4. 验证预付款、阶段款、尾款等金额是否与合同总金额逻辑一致(如各阶段付款金额之和是否等于总金额);

5. 检查合同中是否存在金额描述矛盾、字段缺失或金额不一致等问题。

(三) 合同编号、日期等格式校验

1. 自动提取合同编号、签署日期等字段;

6. 判断编号是否重复、是否符合公司命名规范;

7. 核查日期逻辑是否合理,如签署日期是否早于合同起始日期等。

## Workflows

1. 基础信息核查:

- 输入合同文本

- 自动抽取关键字段(合同主体、金额、日期等)

- 执行格式校验与逻辑一致性检查

- 输出核查结果与异常标注

用户的输入为

按照提示词对用户输入进行提取并结构化输出

4、markdown格式转换

由于大模型输出的是markdown格式,使用这个插件(搜索“Markdown转Docx文件”)。选择大模型的输出作为输入

5、结束节点

添加变量,选择类型file,

以上最小可行合同信息提取dify工作流就建好了,点击运行上传文档看效果。

http://www.dtcms.com/a/358577.html

相关文章:

  • 【C++】AVL树(详解)
  • Coze源码分析-API授权-获取令牌列表-前端源码
  • Spring注解演进与自动装配原理深度解析:从历史发展到自定义Starter实践
  • 逆向思维下,如何把基金投资做亏?
  • 佛山B2B企业GEO搜索优化科普指南
  • 模拟实现STL中的list容器
  • vue中的与,或,非
  • C++:list容器--模拟实现(下篇)
  • 粒子群优化算法(PSO)
  • vscode terminal远程连接linux服务器GUI图形界面
  • Linux/UNIX系统编程手册笔记:文件I/O、进程和内存分配
  • Ferris Wheel (贪心 | 双指针)
  • 【MogDB】在刚发布的银河麒麟v11上安装MogDB
  • 微电网调度(风、光、储能、电网交互)(MatlabPython代码实现)
  • open webui源码分析13-模型管理
  • Python生成免安装exe
  • 承上启下的JDK13安装步骤及下载(附小白详细教程)
  • Transformer朴素采样时,生成 T 个 token 需要的 FLOPs 计算推导过程
  • sunset: 1渗透测试
  • 《HM-RAG: Hierarchical Multi-Agent Multimodal Retrieval Augmented Generation》
  • Java中使用正则表达式的正确打开方式
  • 《微服务架构从故障频发到自愈可控的实战突围方案》
  • C++抽象类
  • Photoshop - Ps 编辑图像
  • 在PowerPoint和WPS演示让蝴蝶一直跳8字舞
  • 干掉抽取壳!FART 自动化脱壳框架与 Execute 脱壳点解析
  • 迷你电脑用到什么型号的RJ45网口
  • 【系列08】端侧AI:构建与部署高效的本地化AI模型 第7章:架构设计与高效算子
  • 文件夹和文件一键加密,保护你的隐私
  • 计算机算术8-浮点加法