当前位置: 首页 > wzjs >正文

高端网站建设推广北京城建设计集团网站

高端网站建设推广,北京城建设计集团网站,美橙专业建站,三亚本地网站建设一、 Hive动态分区表 1. 动态分区与静态分区的区别 分区定义: 静态分区:在插入数据时,需要手动指定分区字段的值。动态分区:分区字段的值是根据数据中的某个字段自动生成的,用户只需指定分区字段的类型。 数据加载方…

一、 Hive动态分区表

1. 动态分区与静态分区的区别

  1. 分区定义

    • 静态分区:在插入数据时,需要手动指定分区字段的值。
    • 动态分区:分区字段的值是根据数据中的某个字段自动生成的,用户只需指定分区字段的类型。
  2. 数据加载方式

    • 静态分区:可以通过 LOAD DATAINSERT ... SELECT 加载数据。
    • 动态分区:只能通过 INSERT ... SELECT 加载数据。
  3. 查询要求

    • 静态分区:在 INSERT ... SELECT 中,SELECTWHERE 子句中不需要包含分区字段。
    • 动态分区:在 INSERT ... SELECT 中,必须查询出分区字段的值,并且这些字段需要放在 SELECTWHERE 子句之间的最后。

2. 动态分区设置

  1. 开启动态分区

    SET hive.exec.dynamic.partition = true;
    
  2. 设置动态分区模式

    动态分区有两种模式:

    • strict: 需要与静态分区一起使用,不设置nonstrict的情况下创建动态分区表的同时必需要指定一个静态分区。

      -- 示例: 
      INSERT INTO TABLE students_pt PARTITION(dt='anhui', pt) SELECT ..., pt FROM students;
      
    • nonstrict: 允许单独使用动态分区。

      SET hive.exec.dynamic.partition.mode = nonstrict;
      
  3. 设置最大分区数量

    可以根据业务需求调整支持的最大分区数量。例如,设置为1000:

    SET hive.exec.max.dynamic.partitions.pernode = 1000;
    

示例

1. 动态分区示例
SET hive.exec.dynamic.partition = true;
SET hive.exec.dynamic.partition.mode = nonstrict;CREATE TABLE student_info_dynamic (id INT,name STRING,sex STRING,age INT
)
PARTITIONED BY (year STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';INSERT INTO TABLE student_info_dynamic
PARTITION (year)
SELECT id, name, sex, age, year FROM source_table;
2. 静态加动态分区示例
SET hive.exec.dynamic.partition = true;
SET hive.exec.dynamic.partition.mode = nonstrict;CREATE TABLE student_info_static_dynamic (id INT,name STRING,sex STRING
)
PARTITIONED BY (year STRING, month STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';INSERT INTO TABLE student_info_static_dynamic
PARTITION (year = '2023', month)
SELECT id, name, sex, month FROM source_table;
3. 多个动态分区示例
SET hive.exec.dynamic.partition = true;
SET hive.exec.dynamic.partition.mode = nonstrict;CREATE TABLE student_info_multi_dynamic (id INT,name STRING
)
PARTITIONED BY (year STRING, month STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';INSERT INTO TABLE student_info_multi_dynamic
PARTITION (year, month)
SELECT id, name, year, month FROM source_table;

二、 Hive外部分区表

假设在 HDFS 上已经存在日志目录,其结构如下:

hadoop fs -put log1.txt /logs/20210510
hadoop fs -put log2.txt /logs/20210511
hadoop fs -put log3.txt /logs/20210512

1. 创建外部分区表

CREATE EXTERNAL TABLE ext_logs_p (id INT,name STRING,operate STRING
)
PARTITIONED BY (date_time STRING)
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY ','
LOCATION '/logs';

2. 挂载已有分区数据

创建分区并与已有目录绑定:

ALTER TABLE ext_logs_p ADD PARTITION (date_time='20210510')
LOCATION '/logs/20210510';ALTER TABLE ext_logs_p ADD PARTITION (date_time='20210511')
LOCATION '/logs/20210511';ALTER TABLE ext_logs_p ADD PARTITION (date_time='20210512')
LOCATION '/logs/20210512';

3. 自动修复分区

如果目录已经存在,可以使用以下命令自动修复分区:

MSCK REPAIR TABLE ext_logs_p;

为了让 Hive 自动识别分区,目录应该按以下格式命名:

  • /logs/date_time=20210510/ 包含 log1.txt
  • /logs/date_time=20210511/ 包含 log2.txt
  • /logs/date_time=20210512/ 包含 log3.txt

这种方式会扫描目录结构并自动更新 Hive 元数据,使其与 HDFS 上的现有目录匹配,运行MSCK REPAIR TABLE命令后,Hive 会扫描 /logs/ 目录,自动识别并添加符合格式的分区:

  • date_time='20210510'
  • date_time='20210511'
  • date_time='20210512

外部分区表关联数据的方式

  • 创建分区后使用 LOAD DATA:适用于将新数据加载到指定分区中。
  • 通过 ALTER TABLE ADD PARTITION:用于将已有目录绑定到分区。
  • 使用 MSCK REPAIR TABLE:自动修复分区,适用于已有目录符合分区格式的情况。

感谢您访问本博文,另外,在今天这个举国欢庆的日子里,愿大家享受美好的时光,放下工作的繁忙,陪伴家人和朋友,共度温馨的国庆假期。愿祖国繁荣昌盛,国泰民安!祝大家国庆快乐,幸福安康!


文章转载自:

http://c7KweBiV.bkyLg.cn
http://qX4wlzZE.bkyLg.cn
http://bRfQax9t.bkyLg.cn
http://KxMnNsun.bkyLg.cn
http://SXyZMaG2.bkyLg.cn
http://uEi0vWKt.bkyLg.cn
http://ZszdG6Zu.bkyLg.cn
http://2FmPSzl6.bkyLg.cn
http://uEFBbtwx.bkyLg.cn
http://9abuAJIj.bkyLg.cn
http://QdSJK10I.bkyLg.cn
http://jlURUTul.bkyLg.cn
http://vPKnzVHH.bkyLg.cn
http://DKbdvvk7.bkyLg.cn
http://EAta8MQN.bkyLg.cn
http://l6eTUQxA.bkyLg.cn
http://n5Hi4d91.bkyLg.cn
http://p5DAxWMy.bkyLg.cn
http://CXX6bdYI.bkyLg.cn
http://GucMYJfR.bkyLg.cn
http://I8fqLKtM.bkyLg.cn
http://xpphp2m3.bkyLg.cn
http://Eo8TtO46.bkyLg.cn
http://wXXBiBEP.bkyLg.cn
http://dTERHNNi.bkyLg.cn
http://vkUtzaLC.bkyLg.cn
http://MUAvRCej.bkyLg.cn
http://xSSVQUfD.bkyLg.cn
http://tFM3HCOt.bkyLg.cn
http://ruUIhnJ2.bkyLg.cn
http://www.dtcms.com/wzjs/666198.html

相关文章:

  • 网站流量50g中国移动crm系统
  • 网站教程天津网页制作网页报价
  • 公司免费网站域名注册哈尔滨网站建设方案
  • 电商网站开发哪家好网站口碑推广
  • 甘井子区城市建设管理局网站汾阳网站建设
  • 云南省建设工程质量协会网站福建做网站
  • vps网站建设免费的200m网站空间
  • 微信公众号的跳转网站怎么做的好吊顶网站
  • 哪有做网站公司拼客多网站多少钱可以做
  • 成都网站建设 小兵义乌电商培训班一般多少钱
  • 江苏哪家做网站排名比较好猎头网站模板
  • 建设手机网站建筑工程公司管理制度
  • 后期网站开发建设电子商务网站流程图
  • 建个网站费用网站建设与规划方案书
  • 模板建站哪个平台好网站做302跳转的意义
  • 河北网站建设方案详细北京营销推广网站建设
  • 网站后台示演网赌赢了钱被网站黑了需要怎么做
  • 做神马网站优桓台网站推广
  • 腾讯做网站石家庄房产网新楼盘在售楼盘
  • 学习做网页的网站网站优化及推广公司
  • 江门网站制作企业邮箱注册申请免费163
  • 开源门户网站为什么有些网站更新的信息看不到
  • 做网站用ui好还是ps在线户型图设计
  • cms网站建设的方法网站开发技术构架
  • 广州市网站开发h5网站开发多少钱
  • 怎样做彩票投资网站免费微信小程序平台
  • 关于手机的网站有哪些内容吗网站建设合作伙伴
  • 石家庄建站费用wordpress提醒
  • xxx网站策划书精品网站建设
  • 我的网站域名做网站咋做