当前位置: 首页 > wzjs >正文

app 设计网站建设站长网站

app 设计网站建设,站长网站,本地旅游网站模版,池州网站建设a) 定义 在此模式下,将append table视为由bucket分隔的queue。 同一bucket中的每条record都是严格排序的,流式读取将完全按照写入顺序将record传输到下游。 使用此模式,无需特殊配置,所有数据都将作为queue进入一个bucket&…
a) 定义

在此模式下,将append table视为由bucket分隔的queue。

同一bucket中的每条record都是严格排序的,流式读取将完全按照写入顺序将record传输到下游。

使用此模式,无需特殊配置,所有数据都将作为queue进入一个bucket,还可以定义bucketbucket-key,以启用更大的并行度和分散数据。

在这里插入图片描述

b) Compaction

默认情况下,sink node将自动执行compaction以控制文件数量,以下参数调整compaction策略:

KeyDefaultTypeDescription
write-onlyfalseBooleanIf set to true, compactions and snapshot expiration will be skipped. This option is used along with dedicated compact jobs.
compaction.min.file-num5IntegerFor file set [f_0,…,f_N], the minimum file number which satisfies sum(size(f_i)) >= targetFileSize to trigger a compaction for append table. This value avoids almost-full-file to be compacted, which is not cost-effective.
compaction.max.file-num50IntegerFor file set [f_0,…,f_N], the maximum file number to trigger a compaction for append table, even if sum(size(f_i)) < targetFileSize. This value avoids pending too much small files, which slows down the performance.
full-compaction.delta-commits(none)IntegerFull compaction will be constantly triggered after delta commits.
c) Streaming Source

目前仅支持Flink引擎。

i)Streaming Read Order

对于streaming reads,records按以下顺序生成:

  • 两条记录来自不同的分区
    • 如果scan.plan-sort-partition设置为true,分区值较小的记录将先生成。
    • 否则,将首先生成具有较早分区创建时间的记录。
  • 两条记录来自同一分区的同一个桶,先written的记录将先生成。
  • 两条记录来自同一分区的两个不同桶,不同的桶由不同的任务处理,它们之间不保证有序。
ii) Watermark 定义

定义reading Paimon tables的watermark。

CREATE TABLE T (`user` BIGINT,product STRING,order_time TIMESTAMP(3),WATERMARK FOR order_time AS order_time - INTERVAL '5' SECOND
) WITH (...);-- launch a bounded streaming job to read paimon_table
SELECT window_start, window_end, COUNT(`user`) FROM TABLE(TUMBLE(TABLE T, DESCRIPTOR(order_time), INTERVAL '10' MINUTES)) GROUP BY window_start, window_end;

可以启用Flink Watermark alignment,确保没有sources/splits/shards/partitions额外增加watermarks:

KeyDefaultTypeDescription
scan.watermark.alignment.group(none)StringA group of sources to align watermarks.
scan.watermark.alignment.max-drift(none)DurationMaximal drift to align watermarks, before we pause consuming from the source/task/partition.
iii) Bounded Stream

Streaming Source可以有界,指定"scan.bounded.watermark"定义有界流模式的结束条件,遇到更大的watermark snapshot时stream reading将结束。

snapshot中的Watermark由writer生成,例如,指定kafka source并定义watermark,当使用此kafka source写入Paimon表时,Paimon表的snapshots将生成相应的watermark,以便在streaming reads此Paimon表时使用bounded watermark功能。

CREATE TABLE kafka_table (`user` BIGINT,product STRING,order_time TIMESTAMP(3),WATERMARK FOR order_time AS order_time - INTERVAL '5' SECOND
) WITH ('connector' = 'kafka'...);-- launch a streaming insert job
INSERT INTO paimon_table SELECT * FROM kakfa_table;-- launch a bounded streaming job to read paimon_table
SELECT * FROM paimon_table /*+ OPTIONS('scan.bounded.watermark'='...') */;

d)创建Append table并指定bucket key示例

CREATE TABLE MyTable (product_id BIGINT,price DOUBLE,sales BIGINT
) WITH ('bucket' = '8','bucket-key' = 'product_id');
http://www.dtcms.com/wzjs/284011.html

相关文章:

  • 网站测试的目的是什么自己开网站怎么开
  • 做兼职 那个网站靠谱seo整站优化外包公司
  • 网站怎么做视频福建seo优化
  • 门户网站开发意义今天的病毒感染情况
  • 拱墅区网站建设国际机票搜索量大涨
  • 濮阳网站建设 公司名字运营培训班
  • 南通教育平台网站建设网络推广常见的方法
  • 外贸公司需要什么资质搜索引擎优化培训免费咨询
  • 网站如何做流媒体怎么做网络推广赚佣金
  • 济南做网站哪家公司好seo优化教程下载
  • 网站注册便宜google play store
  • mac可以做网站开发吗seo推广计划
  • 分销系统商城福州seo建站
  • 免费网站建设公司推荐搜索引擎入口网址
  • 免费企业网站建设哪种商业软文代写
  • 北京有做网站的吗上海搜索优化推广哪家强
  • inititle 网站建设简述获得友情链接的途径
  • 网页设计网站免登陆百度推广电话是多少
  • 淘宝首页网站怎么做易推广
  • 域名查询网站网站免费下载安装
  • 做网站怎样产生效益怎么自己注册网站平台了
  • 信专业广州网站建设产品推广文案范例
  • 郴州网站seo网站访问量统计工具
  • 金华建设工程网站做网站怎么赚钱
  • 基础设施建设的网站电子商务网站设计方案
  • 在线代理网页代理seo岗位
  • 网站怎么做转发域名解析ip138在线查询
  • 政府门户网站工作建设高清视频线转换线
  • 企业融资的意义谷歌seo博客
  • 公司的网站怎么做推广方案百度推广关键词技巧定价