当前位置：首页 > news >正文

基于Coze平台的自动化情报采集与处理引擎—实现小红书图文到飞书的端到端同步

news 2025/8/2 16:29:02

本文介绍了一个基于Coze平台的智能工作流设计与实现，旨在解决内容运营中信息采集、处理与归档的自动化难题。该系统通过集成小红书内容提取、OCR文字识别及飞书多维表格同步三大核心功能，构建了一套完整的“信息获取-智能解析-结构化存储”闭环。项目不仅实现了技术上的创新，更在实际应用中显著提升了工作效率，为内容创作者和运营团队提供了强大的数据支持。

1. 项目背景与目标

在当前的社交媒体生态中，小红书已成为重要的内容分发与用户互动平台。然而，手动收集、整理和分析小红书笔记信息耗时耗力，且容易出错。本项目的目标是构建一个自动化智能体，能够：

自动提取：精准抓取小红书笔记的标题、作者、文案、图片及视频链接。
深度解析：利用OCR技术识别图片中的隐藏文字，补充完整信息。
智能整理：对提取和识别出的信息进行语义重构与格式化。
无缝同步：将处理后的结构化数据自动写入飞书多维表格，实现集中管理和分析。

2. 整体架构

2.1 人设与回复逻辑

# 角色
你是一名专业的小红书文案助手，热情友好且耐心细致。你的任务是引导用户发送小红书分享链接，之后通过调用工作流提取小红书的内容并进行回复。## 技能
### 技能 1: 引导用户发送链接
当用户与你交流时，友好地提示用户发送小红书分享链接，例如：“请您分享一下小红书链接哦，这样我就能为您提取相关内容啦。”### 技能 2: 提取并回复内容
1. 当收到用户发送的小红书链接后，调用工作流提取小红书的内容。
2. 对提取到的内容进行整理和总结，以清晰、有条理的方式向用户回复。## 限制:
- 仅围绕用户提供的小红书链接展开工作，不处理其他无关话题。
- 回复内容需基于提取到的小红书内容，不得编造虚假信息。
- 回复内容应简洁明了，避免过于冗长和复杂的表述。

2.2 创建工作流

在这里插入图片描述

2.2.1 小红书文章信息

添加插件，搜索小红书文章信息提取插件
在这里插入图片描述

URL：85 【闹钟一响，你我皆是牛马，高清壁纸 - 满季 | 小红书 - 你的生活兴趣社区】 😆 1ceZ3xxzMJcfQLM 😆 https://www.xiaohongshu.com/discovery/item/683674bb0000000022037d27?source=webshare&xhsshare=pc_web&xsec_token=ABi29iy8hFMqCejMZunYS1xsITSzFgl3Bw7fyyUfrsqNE=&xsec_source=pc_share

在这里插入图片描述
基于输入的小红书文章的URL，提取小红书文章网页详细信息，包括作者信息、文章标题、内容、图片链接、视频链接、点赞、收藏、分享、评论等信息。

2.2.2 OCR插件批量识别图片

在这里插入图片描述
批量处理：对imageList中的每一张图片调用OCR插件。得到一个包含每张图片识别结果的ocrList数组。

在这里插入图片描述

2.2.3 整理ORC的图片文字流

已获取识别结果，但数据为JSON格式，需要对数组内容进行字符串拼接处理。建议添加"大模型"插件（重命名为"处理OCR结果"）来实现此功能。

在这里插入图片描述
系统提示词：

# 角色
你是一位专业的文本信息组装助手，擅长精准处理OCR提取出的文字信息。能巧妙地将这些信息整合为通顺连贯的语句，运用恰当的标点符号清晰划分语句，同时敏锐地识别并修正其中的错别字，最终提供高质量的修复内容。## 技能
### 技能 1: 高效组装与修复文本
1. 迅速接收OCR提取出的文字信息。
2. 全面深入分析信息，将其巧妙组装成语句通顺、表意明确的内容，合理运用标点符号进行断句。
3. 细致检查语句，精准找出并修复存在的错别字。
4. 清晰规范地返回修复后的文案。## 限制
- 输出内容中无需包含时间和日期信息。
- 仅返回修复后的文案，若内容为空，直接返回空值。
- 为每个结果添加序号，按行逐一列出 。

用户提示词：

{{input}}

在这里插入图片描述

📌注：

关于用户提示词和系统提示词：

定义
用户提示词：由使用者输入，通常是用户希望模型完成的具体任务、问题或请求。
系统提示词：由模型的开发者或管理员设定，目的是指导模型的行为、风格和输出方式。
目的
用户提示词：直接反映用户的需求，旨在获取特定的信息或完成某项任务。
系统提示词：用于设置模型的上下文和预期行为，确保模型能够按照预定的方式响应用户请求。

2.2.4 集成结果

我们不仅需要OCR识别的结果，还需要包括标题和详细描述等关键信息。现需添加一个集成大模型（重命名为"集成结果"）

在这里插入图片描述
系统提示词：

# 角色
你是一个高效准确的内容整理助手，能够按照特定格式输出相关信息，并将数组内容按顺序输出。## 技能
### 技能 1: 整理信息
1. 当接收到需要整理的信息时，按照以下格式输出：
【标题】
【作者】
【内容】
【图片列表】
【图片文字解析】
2. 对于图片列表，只需要给出链接，每个链接后面换行处理。
3. 对于图片文字解析，每一个解析前标注序号。## 限制:
- 必须严格按照给定的格式输出信息，不能偏离框架要求。
- 确保图片链接的准确性和有效性。
- 图片文字解析序号要清晰、连续。

用户提示词:

标题：{{title}}
作者：{{nickname}}
内容：{{desc}}
图片：{{imageList}}
图片文字解析：{{ocrjieguo}}

在这里插入图片描述

2.2.5 基于大模型实现飞书参数

从开始中引入变量：

在这里插入图片描述
下期间！！！！稍后更新。

查看全文

http://www.dtcms.com/a/304037.html

用 Python 轻松实现时间序列预测：Darts 时间序列混合器（TSMixer）Time Series Mixer

WAIC 2025观察：昇腾助力AI融入多元化生活场景

sqli-labs通关笔记-第25关GET字符注入(过滤or和and 脚本法)

数据手套五指触觉灵巧手遥操作方案

Hyperchain安全与隐私机制详解

Windows 下使用 Ollama 调试大模型

故障排除---Operator部署Prometheus无法NodePort访问

zoho crm为什么xx是deal的关联对象但是调用函数时报错说不是关联对象

译|生存分析Survival Analysis案例入门讲解（一）

电磁兼容（EMC）：整改案例（十三）屏蔽外壳开孔解决433MHz无线通信问题

【硬件-笔试面试题】硬件/电子工程师，笔试面试题-45，（知识点：负反馈的作用，基础理解，干扰和噪声的抑制）

React--》实现 PDF 文件的预览操作

WisFile(文件整理工具) v1.2.19 免费版

自然语言处理NLP（3）

Mac m系列芯片安装node14版本使用nvm + Rosetta 2

【第四章:大模型（LLM)】01.神经网络中的 NLP-(3)文本情感分类实战

网络安全运维面试准备

全自动植树机solidwoeks图纸cad【7张】三维图＋设计说明说

第二十二天（数据结构，无头节点的单项链表）

去掉ansible的相关警告信息

RK3568下的进程间广播通信：用C语言构建简单的中心服务器

人工智能驱动的自动化革命：重塑工作与社会的未来图景

XtestRunner一个比较好用好看的生成测试报告的工具

AI Agent推动搜索引擎优化自动化进程

python-网络编程

【刷题】东方博宜 1503-排序容器排序

【数据结构】真题 2016

怎么理解使用MQ解决分布式事务 -- 以kafka为例

ABP VNext + GraphQL Federation：跨微服务联合 Schema 分层

Java 课程，每天解读一个简单Java之判断101-200之间有多少个素数，并输出所有素数。

1. 项目背景与目标

2. 整体架构

2.1 人设与回复逻辑

2.2 创建工作流

2.2.1 小红书文章信息

2.2.2 OCR插件批量识别图片

2.2.3 整理ORC的图片文字流

2.2.4 集成结果

2.2.5 基于大模型实现飞书参数

相关文章：