当前位置: 首页 > news >正文

Data Sink定义、参数与可落地示例

1. Definition

Data Sink 用于应用上游的 Schema 变更并将变更数据写入外部系统。
一个 Sink 可以同时写入多张表(通常配合 route/transform 完成多表/改名/合并等策略)。

2. Parameters

描述一个 Data Sink 至少包含以下要素:

参数含义必/选
typeSink 类型,例如 dorisstarrocksrequired
nameSink 名称,用户自定义(有默认值)optional
configurations of Data Sink用于构建 Sink 的连接与表属性配置,如连接地址、认证、建表属性等optional

提示:Sink 只负责“写去哪、怎么写”,写什么/写成什么表名通常由 route(或 tableId 约定)决定;字段筛选/列转化可用 transform

3. Example(Doris Sink)

3.1 最小可用(与你提供的示例一致,补了注释)

sink:type: dorisname: doris-sink                 # 可选:便于在 UI/日志中辨识fenodes: 127.0.0.1:8030          # Doris FE 的 HTTP 服务地址(可多节点逗号分隔)username: rootpassword: ""table.create.properties.replication_num: 1   # 可选:建表默认副本数

3.2 常用增强写法(按需添加)

sink:type: dorisfenodes: "fe1:8030,fe2:8030"     # 多 FEusername: sync_userpassword: "******"# ====== 建表级别的默认属性(不存在时可自动建表/按属性创建)======table.create.properties.replication_num: 3table.create.properties.bucket_num: 8table.create.properties.enable_unique_key_merge_on_write: truetable.create.properties.storage_format: V2# ====== 写入/导入相关的一些惯用项(不同版本参数名可能略有差异)======# sink.properties.batch.size:  10485760   # 批次大小(示例)# sink.properties.max-retries: 3          # 重试次数(示例)

说明:

  • table.create.properties.* 前缀用于建表默认参数(当 Sink 负责建表或需要自动建表时非常有用)。

  • 具体可用属性名与默认值可能随 Doris/连接器版本变化,按你的版本文档取舍。

  • 多表写入时,表名通常由 route 决定,例如:

    route:- source-table: app_db.orderssink-table: ods_db.ods_orders
    

4. StarRocks Sink(对照示例)

字段命名与 Doris 十分类似;你可以用同样思路配置 FE 地址与表属性:

sink:type: starrocksname: sr-sinkfenodes: "fe1:8030,fe2:8030"username: rootpassword: ""table.create.properties.replication_num: 3

实际生产请以所用版本的官方参数名为准(例如是否支持更多 table.create.properties.* 或写入缓冲参数)。

5. 实战要点 & 易错点

  1. 连接与权限

    • fenodes 支持多个 FE,建议逗号分隔以提升可用性。
    • 账号需具备目标库表的建表/写入权限(若使用自动建表/自动变更)。
  2. Schema 变更

    • Pipeline 级的 schema.change.behavior(如 lenient/try_evolve)决定遇到 DDL 的处理方式;
    • Sink 侧会应用 Schema 变更(如新列),但目标表模型需兼容(主键/明细模型、默认值策略等)。
  3. 多表写入

    • 通过 route 才能把不同源表准确落到不同目标表
    • 若要将分片表合并到同一目标表,也用 route 的正则匹配实现。
  4. 建表属性前缀

    • 使用 table.create.properties.* 作为默认建表参数前缀;
    • 常见如 replication_numbucket_numstorage_formatenable_unique_key_merge_on_write 等。
  5. 吞吐与稳定性

    • 合理设置批次、并行度与重试(不同版本参数名可能不同);
    • 观察导入延迟、错误率,并配合下游(Doris/StarRocks)导入可观测性指标。

6. 与 Data Pipeline 其余段落的协作方式(速记)

  • source:决定“读什么、从哪读”(支持多表正则);
  • transform:决定“列级变换/过滤/UDF”;
  • route:决定“写到哪个目标表/是否合并分片表/是否改名”;
  • sink(本文主角):决定“如何连接目标系统并落地数据,以及默认建表属性/写入参数”;
  • pipeline:全局并行度、运行模式与 schema 演进策略等。
http://www.dtcms.com/a/587299.html

相关文章:

  • 青岛网站设计网站wordpress 评论 邮箱
  • 杭州论坛网站制作diy电子商城网站
  • 做网站页面需要的资料安徽建设工程网
  • 网站建设中需要注意的问题高清短视频素材库无水印
  • 手机网站与pc网站同步广东茂名网站建设
  • 网站安全狗 拦截301xly000.WordPress.cok
  • 确山专业网站建设南昌师范学院网站建设的意义和目的
  • 权威的网站制作视频解析网站怎么做的
  • 公司注册网站官网郑州网站开发公司
  • 云南网站设计定制找网页设计公司去哪个平台
  • 网页设计与网站建设电话湖南建筑网
  • 网站升级建设方案开发公司网站建设
  • 阿里云有域名之后怎么建设网站我要招人在哪个网站招
  • python 做网站怎样潍坊美丽乡村建设一般发了哪个网站
  • 十大网站建立公司小程序宣传推广方案
  • 第1章 GIS基础入门
  • FPGA教程系列-Vivado IP核DDS核
  • 网站设计参考网站网站建设 费用 入哪个科目
  • 郑州企业网站建设网站制作公司网址
  • 淘宝网站建设退款wordpress应用和lamp
  • 分享一个基于微信小程序的网络安全知识科普平台的设计与实现,网络安全教育智能答疑小程序|在线测试科普宣传小程序
  • 济宁建设局官方网站网站建设与运行
  • 搭建一个公司网站常州设计网站
  • 比特币交易所网站开发黄页网站推广app软件
  • 怎样做站长建网站达州seo
  • 广州货运网站建设如何给网站做后台
  • 做微信公众号的网站西安企业做网站
  • linux安装配置nexus3.86
  • 电子商务网站后台核心管理金峰辉网站建设
  • 公司网站做的很烂软件培训班学费多少