当前位置: 首页 > wzjs >正文

宿迁建设局网站好搜自然seo

宿迁建设局网站,好搜自然seo,服装租赁 网站 php,wordpress内容页主题修改背景:Flink数据写入到stage层,然后再入ods层,中间导致hive数据实时性不强,随后做优化,Flink之间以orc格式写入到hive 问题:单表日800亿数据量,产生过多的小文件,影响Impala查询 解决:对hive小文件进行合并, ALTER TABLE lt_ipsy_xdr_temp PARTITION (day20230829, hour9,type…

背景:Flink数据写入到stage层,然后再入ods层,中间导致hive数据实时性不强,随后做优化,Flink之间以orc格式写入到hive

问题:单表日800亿数据量,产生过多的小文件,影响Impala查询

解决:对hive小文件进行合并,

ALTER TABLE lt_ipsy_xdr_temp PARTITION (day=20230829, hour=9,type=4) CONCATENATE;

目前大数据平台hdfs数据存储情况:

数据仓库中的表:
1.stg层是把flink应用程序写入的数据load进入的;
2.ods层表名称中包含ai的表是从mysql导入的; 
/_SCRATCH0 这些目录是sqoop 把mysql数据导入hive时生成的临时目录,可以删除。
3.stg 和 ods 的 tb_bu_dc_monitor_day 是外部表,其他层的表都是内部表;
4.stg层是原始数据,没有经过压缩处理,ods及以后其他各层都是orc格式
 

使用hive concatenate (外部表不可用,内部表可用,orc可用,分桶表不可用)
使用方式:

#1.设置文件最小大小(需要设置,否则合并操作可能会不理想):
SET mapreduce.input.fileinputformat.split.maxsize=256
#对于非分区表
alter table A concatenate;
#2.对于分区表
ALTER TABLE lt_ipsy_xdr_temp PARTITION (day=20230829, hour=9,type=4) CONCATENATE;

因为分桶表不适用,所以可以采用覆写的方式

INSERT OVERWRITE TABLE table 

PARTITION (day=20230908,hour=9,datatype=4)
SELECT 
a,b,c,d,e
FROM table 
where day=20230908 and hour=9 and datatype=4;

http://www.dtcms.com/wzjs/165887.html

相关文章:

  • 做网站最便宜要多少钱如何写软文
  • 前端开发主要做什么seo怎么做?
  • 漳州开发区人才网seo网站排名优化软件是什么
  • 哪个网站兼职做图好希爱力双效片副作用
  • 成都房地产管理局关键词长尾词优化
  • 北京做网站开发公司哪家好关键词的作用
  • 湛江网站建设湛江sem托管公司
  • 石家庄商城网站建设十大中文网站排名
  • 设计制作费税率在线排名优化
  • 建筑工程挂网甩浆余姚seo智能优化
  • 广州中企动力网站制作人民日报评网络暴力
  • 网站加速器quickq怎样优化网站排名靠前
  • wordpress视频播放器插件下载佛山网站优化
  • 河南省住房与城乡建设部网站阿里指数查询入口
  • 网站备案拍照网站查询站长工具
  • 大连网站设计费用怎么自己做一个网页
  • 西安学校网站建设价格网上的推广公司
  • 做俄罗斯外贸网站推广网络营销策划活动方案
  • 重庆网站建设公司那家好镇江网站建设推广
  • 哈尔滨建站费用青岛网站seo诊断
  • 自己做软件 做网站需要学会哪些网站优化是什么意思
  • 东莞商城网站建设哪里比较好营销方式有哪几种
  • 做视频网站需要流量进行优化
  • 福建城市建设厅网站seo引擎搜索网站关键词
  • 合肥商城网站建设多少钱seo网站优化知识
  • 做电商网站要备案吗搜索引擎是什么
  • 山东建设监理协会网站黑帽seo培训多少钱
  • 网站做细分领域宁波网站推广联系方式
  • 医院网站建设平台系统清理优化工具
  • 自己做链接的网站优化师的工作内容