当前位置: 首页 > news >正文

【hadoop】sqoop案例 hive->mysql

将temperature.log中的气象数据导入到Hive的temperature表中,

根据气象站id分组计算每个气象站30年来的*最高*气温,

然后将统计结果导出到MySQL当中。

 思路:

1.在hive中创建表

2.数据导入到表中

3.计算后的结果写入另外的表

4.用sqoop导出到mysql

 


1.在hive中创建表

hivehive> create database if not exists temperature_db;hive> use temperature_db;hive> create table temperature_tb(id int,year string,temperature string) row format delimited fields terminated by ',';

2.数据导入到表中 

先上传文件到虚拟机,然后输入load data local inpath... into命令加载数据到数据库。

load data local inpath '/home/hadoop/temperature.log' into table temperature_tb;

 

3.计算后的结果写入另外的表

CREATE TABLE temperature_max_by_id AS
SELECT id, MAX(temperature) AS max_temperature
FROM temperature_tb
WHERE `year` >= STRING(YEAR(CURRENT_DATE()) - 30)
GROUP BY id;

DESCRIBE FORMATTED temperature_db.temperature_max_by_id;

可以查看表在hdfs中的位置。 

 

 4.使用 Sqoop 导出到 MySQL

注意:要提前在mysql中创建表

USE temperature_db; CREATE TABLE IF NOT EXISTS temperature (id INT, max_temperature VARCHAR(50));

~/sqoop/bin/sqoop export \--connect jdbc:mysql://localhost/temperature_db \--username root \--password 123456 \--table temperature \--export-dir /user/hive/warehouse/temperature_db.db/temperature_max_by_id \--input-fields-terminated-by ',' \-m 1

 

http://www.dtcms.com/a/192063.html

相关文章:

  • python克洛伊婚纱摄影预约管理系统
  • 纯前端实现基于位置的天气和动态背景图片
  • 【优化算法】协方差矩阵自适应进化策略(Covariance Matrix Adaptation Evolution Strategy,CMA-ES)
  • [项目深挖]仿muduo库的并发服务器的解析与优化方案
  • 解决ubuntu20中tracker占用过多cpu,引起的风扇狂转
  • 人体肢体工作识别-一步几个脚印从头设计数字生命——仙盟创梦IDE
  • MySQL读写分离
  • 【CF】Day59——Codeforces Round 914 (Div. 2) D
  • JS手写代码篇---手写 Object.create
  • 【生活相关-日语-日本-东京-搬家后-引越(ひっこし)(3)-踩坑点:国民健康保险】
  • Xinference推理框架
  • Redis(2):Redis + Lua为什么可以实现原子性
  • Spark--RDD中的转换算子
  • 【hadoop】Kafka 安装部署
  • VSTO(C#)Excel开发进阶2:操作图片 改变大小 滚动到可视区
  • 安卓A15系统实现修改锁屏界面默认壁纸功能
  • Excel在每行下面插入数量不等的空行
  • React Native简介
  • 单片机 | 基于STM32的智能马桶设计
  • Windows平台OpenManus部署及WebUI远程访问实现
  • .NET 8 kestrel 配置PEM,实现内网https
  • 前端学习:align-items 和 justify-content 概念和区别
  • JAVA:ResponseBodyEmitter 实现异步流式推送的技术指南
  • 【抽丝剥茧知识讲解】引入mybtis-plus后,mapper实现方式
  • (面试)Handler消息处理机制原理
  • Linux进程通讯和原子性
  • Ubuntu shell指定conda的python环境启动脚本
  • python使用matplotlib无法显示中文字体报错
  • Spring Cloud探索之旅:从零搭建微服务雏形 (Eureka, LoadBalancer 与 OpenFeign实战)
  • 【鸿蒙开发】性能优化