当前位置: 首页 > wzjs >正文

做网站内容软件网站建设服务器的选择方案

做网站内容软件,网站建设服务器的选择方案,个人外贸网站制作,深圳专业网站设计制作Flink CDC 是一个基于流的数据集成工具,旨在为用户提供一套功能更加全面的编程接口(API),它基于数据库日志的 CDC(变更数据捕获)技术实现了统一的增量和全量数据读取。 该工具使得用户能够以 YAML 配置文件…

Flink CDC 是一个基于流的数据集成工具,旨在为用户提供一套功能更加全面的编程接口(API),它基于数据库日志的 CDC(变更数据捕获)技术实现了统一的增量和全量数据读取。 该工具使得用户能够以 YAML 配置文件的形式,优雅地定义其 ETL(Extract, Transform, Load)流程,并协助用户自动化生成定制化的 Flink 算子并且提交 Flink 作业。 Flink CDC 在任务提交过程中进行了优化,并且增加了一些高级特性,如表结构变更自动同步(Schema Evolution)、数据转换(Data Transformation)、整库同步(Full Database Synchronization)以及 精确一次(Exactly-once)语义。

Flink CDC 深度集成并由 Apache Flink 驱动,提供以下核心功能:

  • ✅ 端到端的数据集成框架
  • ✅ 为数据集成的用户提供了易于构建作业的 API
  • ✅ 支持在 Source 和 Sink 中处理多个表
  • ✅ 整库同步
  • ✅具备表结构变更自动同步的能力(Schema Evolution)

一、如何使用 Flink CDC

Flink CDC 提供了基于 YAML 格式的用户 API,更适合于数据集成场景。以下是一个 YAML 文件的示例,它定义了一个数据管道(Pipeline),该Pipeline从 MySQL 捕获实时变更,并将它们同步到 Apache Doris:

source:type: mysqlhostname: localhostport: 3306username: rootpassword: 123456tables: app_db.\.*server-id: 5400-5404server-time-zone: UTCsink:type: dorisfenodes: 127.0.0.1:8030username: rootpassword: ""table.create.properties.light_schema_change: truetable.create.properties.replication_num: 1pipeline:name: Sync MySQL Database to Dorisparallelism: 2

通过使用 flink-cdc.sh 提交 YAML 文件,一个 Flink 作业将会被编译并部署到指定的 Flink 集群。

二、理解核心概念

1、Data Pipeline

由于Flink CDC中的事件以管道方式从上游流向下游,因此整个ETL任务被称为数据管道。

我们可以使用下面的yaml文件来定义一个简洁的数据管道,描述将MySQL app_db数据库下的所有表同步到Doris:

  source:type: mysqlhostname: localhostport: 3306username: rootpassword: 123456tables: app_db.\.*sink:type: dorisfenodes: 127.0.0.1:8030username: rootpassword: ""pipeline:name: Sync MySQL Database to Dorisparallelism: 2

 我们可以使用下面的yaml文件定义一个复杂的数据管道,描述将MySQL app_db数据库下的所有表同步到Doris,并给出特定的目标数据库名称ods_db和特定的目标表名称前缀ods_:

 source:type: mysqlhostname: localhostport: 3306username: rootpassword: 123456tables: app_db.\.*sink:type: dorisfenodes: 127.0.0.1:8030username: rootpassword: ""transform:- source-table: adb.web_order01projection: \*, format('%S', product_name) as product_namefilter: addone(id) > 10 AND order_id > 100description: project fields and filter- source-table: adb.web_order02projection: \*, format('%S', product_name) as product_namefilter: addone(id) > 20 AND order_id > 200description: project fields and filterroute:- source-table: app_db.orderssink-table: ods_db.ods_orders- source-table: app_db.shipmentssink-table: ods_db.ods_shipments- source-table: app_db.productssink-table: ods_db.ods_productspipeline:name: Sync MySQL Database to Dorisparallelism: 2user-defined-function:- name: addoneclasspath: com.example.functions.AddOneFunctionClass- name: formatclasspath: com.example.functions.FormatFunctionClass

Pipeline 配置: 

支持数据管道级别的以下配置选项:

parametermeaningoptional/required
name管道的名称,将作为作业名称提交到Flink集群。optional
parallelism管道的全局并行性。默认为1。optional
local-time-zone本地时区定义当前会话时区id。optional

2、Data Source

数据源用于访问元数据,并从外部系统读取更改的数据。数据源可以同时从多个表中读取数据。

要描述数据源,需要以下内容:

parametermeaningoptional/required
type数据源的类型,如mysql。required
name数据源的名称,由用户定义(提供默认值)。optional
configurations of Data Source用于构建数据源的配置,例如连接配置和源表属性。optional

source:type: mysqlname: mysql-source   #optional,description informationhost: localhostport: 3306username: adminpassword: passtables: adb.*, bdb.user_table_[0-9]+, [app|web]_order_\.*

3、Data Sink

4、Table Id

5、Transform 

http://www.dtcms.com/wzjs/544160.html

相关文章:

  • 网站哪个好做网站阳泉
  • 陇西 网站开发网站设计说明书功能流程图
  • 在网站上使用特殊字体吧网站做软件的软件下载
  • 南京网站搜索引擎优化WordPress海报
  • dedecms 网站首页标签山东省建设工程执业资格中心网站
  • 网站开发涉及技术批量修改wordpress id
  • 郑州网站制作招聘有一个网站专门做促销小游戏
  • 做网站编辑前景网站的目的及功能规划
  • 做外贸进国外网站网站安全架构
  • 天津行业网站建设多个wordpress站点互相
  • 中石油第六建设公司网站最好的响应式网站有哪些
  • 商标设计网站哪个好网站开发使用软件有哪些
  • 在线教育网站建设方案怎样查询江西省城乡建设厅网站
  • 免费网站建设哪个最好广东手机网站建设多少钱
  • 找个男做那个视频网站好网站规划建设与管理维护大学论文
  • 网站没后台怎么修改类容安徽省建设工程信息网招标公告
  • 模板网站怎么优化页面设计时最好只使用一种颜色避免视觉效果混响
  • 都是做面食网站恋月wordpress
  • 网站设计公司长沙公司安徽网站建设推荐 晨飞网络
  • 河北公司网站建设效果暴雪国服官网入口
  • 中文静态网站下载电动汽车排名前十名
  • 医院网站建设的计划深圳网站软件网站建设
  • 帮网站做代理防恶意点击软件
  • 说明网站建设岗位工作职责wordpress更改上传
  • 玉林网站建设制造业人才网
  • 宠物店网站怎么做网站提示代码
  • 天气网站建设有没有网站做lol网站的
  • 网站建设公司话术简历网站后怎样才能被谷歌 百度收录吗
  • 博物馆网站 建设方案中国站长网入口
  • 哪里能找到免费网站wordpress win主机