当前位置: 首页 > wzjs >正文

环保空调东莞网站建设快速建站平台

环保空调东莞网站建设,快速建站平台,wordpress 调用文章列表,dw网页制作素材网站pb级别迁移通常要持续1个月以上。一般的过程是,全量迁移,追平数据,增量同步,校验,补数。 这里的指定补数脚本: 输入需要补数的表,如Input.txt,如果有分区则加补此分区,没…

pb级别迁移通常要持续1个月以上。一般的过程是,全量迁移,追平数据,增量同步,校验,补数。

这里的指定补数脚本:

输入需要补数的表,如Input.txt,如果有分区则加补此分区,没有分区,则重迁移此表。

input.txt

ods_xxx dt=202403

dwd_xxx 

dwd_xxxd temp

则补数脚本应该满足,迁移ods_xxx/dt=202403分区的数据,迁移dwd_xxx的数据,迁移dwd_xxxd/temp的数据。


input.txt格式

ods_xxr dt=20250214

ods_xi_202402_monitor dt=20250214

代码

#!/bin/bash
#场景:数据在同一库下,并且hive是内部表(前缀的hdfs地址是相同的)#1.读取一个文件,获取表名con_address=hdfs://xx.xx.xx.104:4007#数组,这个值是存在的  表名/分区名或者文件名
fenqu_allow_list=()#检测即将迁移的数据量
total_size=0
while IFS=' ' read -r table_name fenqu_name
dohdfs dfs -count $con_address/apps/hive/warehouse/bigdata.db/$table_name/$fenqu_nameif [ -z "$fenqu_name" ]; thenecho "没有分区,迁移表,检测表大小"elseecho "有分区或文件,检测分区大小或者文件大小"fi#文件大小,字节fenqu_size=$(hdfs dfs -count $con_address/apps/hive/warehouse/bigdata.db/$table_name/$fenqu_name | awk -F ' ' '{print $3}')if [[ "$fenqu_size" =~ ^[0-9]+$ ]]; then#变成GBfenqu_gb=$(echo "scale=2; $fenqu_size / 1073741824" | bc)total_size=$(echo "scale=2;$total_size + $fenqu_gb"| bc)fenqu_allow_list+=("$table_name/$fenqu_name")elseecho "无值$table_name/$fenqu_name" >> fail.txtfi
done < "$1"echo "此批迁移的总大小是$total_size GB"read -p "是否继续? (y/n): " user_input# 判断用户输入
if [[ "$user_input" == "y" || "$user_input" == "Y" ]]; thenecho "即将执行脚本"
elif [[ "$user_input" == "n" || "$user_input" == "N" ]]; thenecho "退出脚本..."exit 0
elseecho "无效输入,退出脚本..."exit 1
fideclare -A repair_map
#迁移指定分区或者文件
for element in "${fenqu_allow_list[@]}"; dotable_name=$(echo "$element" | awk -F'/' '{print $1}')echo "表名是$table_name"#删除对应的内容echo "执行命令 hdfs dfs -rm -r $con_address/apps/hive/warehouse/bigdata.db/$element"hdfs dfs -rm -r $con_address/apps/hive/warehouse/bigdata.db/$element#迁移source_path=hdfs://xx.xx.xx.7:8020/apps/hive/warehouse/bigdata.db/$elementtarget_path=hdfs://xx.xx.xx.104:4007/apps/hive/warehouse/bigdata.db/$elementecho "执行命令 hadoop distcp -skipcrccheck -i -strategy dynamic -bandwidth 30 -m 20 $source_path $target_path"hadoop distcp -skipcrccheck -i -strategy dynamic -bandwidth 30 -m 20 $source_path $target_path#table_name去重repair_map["$table_name"]=1echo "-----------------------"
donefor key in "${!repair_map[@]}"; dotable_name=$key#修复元数据BEELINE_CMD="beeline -u 'jdbc:hive2://xx.xx.xx.104:7001/cfc;principal=hadoop/xx.xx.xx.104@TBDS-09T7KXLE'"# 执行MSCK REPAIR TABLE命令echo "Repairing partitions for table: $table_name"$BEELINE_CMD -e "MSCK REPAIR TABLE $table_name;"if [ $? -eq 0 ]; thenecho "Successfully repaired partitions for table: $table_name"elseecho "Failed to repair partitions for table: $table_name"fi
done

http://www.dtcms.com/wzjs/495539.html

相关文章:

  • 网站菜单实现原理手机制作网站的软件
  • 网页制作商品页面模板资源网站优化排名优化
  • 微信对接网站群重庆seo技术
  • 爱站网长尾挖掘工具收录提交入口
  • 常州做网站公司排名自建站
  • 外贸网站建设内容包括进行网络推广
  • 萧山建站营销方案ppt
  • 网站改版合同书网络推广宣传方式
  • 腾讯云电商网站建设最近的头条新闻
  • 网上书店网网站建设seo企业站收录
  • 国家建设部网站首页网站快速排名服务商
  • 网投网站建设站长工具网址查询
  • 做一个动态网站要多少钱如何自己做一个网址
  • 电子商务网站问题与解决方案东莞网站建设方案报价
  • 黄冈网站推广代运营2022年新闻摘抄简短
  • 互联网行业ppt云南seo简单整站优化
  • 娄底网站建设开发网络推广员
  • 网站如何做谷歌推广宝鸡seo排名
  • 网站内容栏目苏州新闻今天最新消息新闻事件
  • 天津做网站的长春关键词搜索排名
  • 北京营销型网站案例关闭站长工具seo综合查询
  • 邯郸网站建设产品介绍软文营销怎么写
  • 网站建设与管理心得成人短期就业培训班
  • 食品网站开发的背景58黄页网推广公司
  • 网站建设方案报价单百度关键词推广多少钱
  • 中国政府网站建设与应用seo公司品牌哪家好
  • 高端模板网站建设价格线上销售平台有哪些
  • 网站建设faq系统指什么优化排名推广关键词
  • 西安公关公司广州seo效果
  • 成都网站建设g冠辰seo代码优化工具