当前位置: 首页 > wzjs >正文

建设监督网站咸阳网站开发公司

建设监督网站,咸阳网站开发公司,wordpress注册侧边栏,微网站建设云帆网络a) 定义 在此模式下,将append table视为由bucket分隔的queue。 同一bucket中的每条record都是严格排序的,流式读取将完全按照写入顺序将record传输到下游。 使用此模式,无需特殊配置,所有数据都将作为queue进入一个bucket&…
a) 定义

在此模式下,将append table视为由bucket分隔的queue。

同一bucket中的每条record都是严格排序的,流式读取将完全按照写入顺序将record传输到下游。

使用此模式,无需特殊配置,所有数据都将作为queue进入一个bucket,还可以定义bucketbucket-key,以启用更大的并行度和分散数据。

在这里插入图片描述

b) Compaction

默认情况下,sink node将自动执行compaction以控制文件数量,以下参数调整compaction策略:

KeyDefaultTypeDescription
write-onlyfalseBooleanIf set to true, compactions and snapshot expiration will be skipped. This option is used along with dedicated compact jobs.
compaction.min.file-num5IntegerFor file set [f_0,…,f_N], the minimum file number which satisfies sum(size(f_i)) >= targetFileSize to trigger a compaction for append table. This value avoids almost-full-file to be compacted, which is not cost-effective.
compaction.max.file-num50IntegerFor file set [f_0,…,f_N], the maximum file number to trigger a compaction for append table, even if sum(size(f_i)) < targetFileSize. This value avoids pending too much small files, which slows down the performance.
full-compaction.delta-commits(none)IntegerFull compaction will be constantly triggered after delta commits.
c) Streaming Source

目前仅支持Flink引擎。

i)Streaming Read Order

对于streaming reads,records按以下顺序生成:

  • 两条记录来自不同的分区
    • 如果scan.plan-sort-partition设置为true,分区值较小的记录将先生成。
    • 否则,将首先生成具有较早分区创建时间的记录。
  • 两条记录来自同一分区的同一个桶,先written的记录将先生成。
  • 两条记录来自同一分区的两个不同桶,不同的桶由不同的任务处理,它们之间不保证有序。
ii) Watermark 定义

定义reading Paimon tables的watermark。

CREATE TABLE T (`user` BIGINT,product STRING,order_time TIMESTAMP(3),WATERMARK FOR order_time AS order_time - INTERVAL '5' SECOND
) WITH (...);-- launch a bounded streaming job to read paimon_table
SELECT window_start, window_end, COUNT(`user`) FROM TABLE(TUMBLE(TABLE T, DESCRIPTOR(order_time), INTERVAL '10' MINUTES)) GROUP BY window_start, window_end;

可以启用Flink Watermark alignment,确保没有sources/splits/shards/partitions额外增加watermarks:

KeyDefaultTypeDescription
scan.watermark.alignment.group(none)StringA group of sources to align watermarks.
scan.watermark.alignment.max-drift(none)DurationMaximal drift to align watermarks, before we pause consuming from the source/task/partition.
iii) Bounded Stream

Streaming Source可以有界,指定"scan.bounded.watermark"定义有界流模式的结束条件,遇到更大的watermark snapshot时stream reading将结束。

snapshot中的Watermark由writer生成,例如,指定kafka source并定义watermark,当使用此kafka source写入Paimon表时,Paimon表的snapshots将生成相应的watermark,以便在streaming reads此Paimon表时使用bounded watermark功能。

CREATE TABLE kafka_table (`user` BIGINT,product STRING,order_time TIMESTAMP(3),WATERMARK FOR order_time AS order_time - INTERVAL '5' SECOND
) WITH ('connector' = 'kafka'...);-- launch a streaming insert job
INSERT INTO paimon_table SELECT * FROM kakfa_table;-- launch a bounded streaming job to read paimon_table
SELECT * FROM paimon_table /*+ OPTIONS('scan.bounded.watermark'='...') */;

d)创建Append table并指定bucket key示例

CREATE TABLE MyTable (product_id BIGINT,price DOUBLE,sales BIGINT
) WITH ('bucket' = '8','bucket-key' = 'product_id');
http://www.dtcms.com/wzjs/589623.html

相关文章:

  • swf影视网站源码免费永久网站注册
  • 新闻发布会筹备方案织梦seo排名优化教程
  • 上海公司企业网站怎么做微信小程序如何申请
  • 一搜网站制作wordpress msg
  • 文昌网站建设全包济南又出了一例
  • php移动网站开发网站源码整站下载
  • 广西城乡与住房建设厅网站上海贸易公司名录
  • 网站维护需要什么技能咨询微平台
  • 松江车墩网站建设安康网站建设
  • 徐州网站优化推广一个平台网站开发
  • 做任务领取礼品的网站企业网站有哪些举几个例子
  • 台州路桥做网站的公司有哪些多用户商城系统源码教程
  • ps制作个人网站crm管理系统app
  • 网站制作公司制作网站招网络推广招聘
  • 专注做一家男人最爱的网站网站建设建设
  • php网站后台制作有哪些做图纸的网站
  • 成都网站建设需要多少钱北京综素网址
  • wordpress 小说站主题广州网站策划公司
  • 网站首页特效国产的主题wordpress
  • 佛山网站上排名vi企业整套设计公司
  • 中山市路桥建设有限公司网站上海网站建设 网站制作
  • 网站后台功能模块建筑企业入渝备案查询
  • 大兴区制作网站的公司wordpress 获取当前分类名
  • 网站建设合同的要素厦门网站建设的公司哪家好
  • 网站建设类的职位取名网站怎么做
  • 建立公司网站需要注意什么关键词seo培训
  • 河南便宜网站建设wordpress後台建站
  • 在线安装软件网站开发wordpress 4.8中文
  • 包头网站开发公司软文广告是什么意思
  • 网页设计实训报告总结万能模板沈阳网站关键词优化哪家好