当前位置: 首页 > news >正文

基于hive和mapreduce的地铁数据分析及可视化_hive作为数据库

基于hive和mapreduce的地铁数据分析及可视化

项目概况

[👇👇👇👇👇👇👇👇]
点这里,查看所有项目
[👆👆👆👆👆👆👆👆]

数据类型

地铁数据

开发环境

centos7

软件版本

hadoop3.2.0、hive3.1.2、mysql5.7.38、jdk8、sqoop1.4.7

开发语言

Java

开发流程

数据上传(hdfs)->数据分析(mapreduce和hive)->后端(springboot)->前端(html+js+css)

可视化图表

在这里插入图片描述

操作步骤

启动MySQL


# 查看mysql是否启动 启动命令: systemctl start mysqld.service
systemctl status mysqld.service
# 进入mysql终端
# MySQL的用户名:root 密码:123456
# MySQL的用户名:root 密码:123456
# MySQL的用户名:root 密码:123456
mysql -uroot -p123456

启动Hadoop


# 离开安全模式: hdfs dfsadmin -safemode leave
# 启动hadoop
bash /export/software/hadoop-3.2.0/sbin/start-hadoop.sh

启动hive


# 在第一个窗口中,执行后等待10-20秒
/export/software/apache-hive-3.1.2-bin/bin/hive --service metastore# 在第二个窗口中,执行后等待10-20秒
/export/software/apache-hive-3.1.2-bin/bin/hive --service hiveserver2# 连接进入hive终端命令如下:
# /export/software/apache-hive-3.1.2-bin/bin/beeline -u jdbc:hive2://master:10000 -n root

准备目录


mkdir -p /data/jobs/project/
cd /data/jobs/project/# 上传 "project-hive-mapreduce-subway-analysis-data-screen/project_subway_station/data/" 目录下的 "subway_station.csv" 文件 到 "/data/jobs/project/" 目录

上传文件到hdfs


cd /data/jobs/project/hdfs dfs -mkdir -p /data/input/
hdfs dfs -rm -r /data/input/*
hdfs dfs -put -f subway_station.csv /data/input/
hdfs dfs -ls /data/input/

程序打包


cd /data/jobs/project/# 对 "project-hive-mapreduce-subway-analysis-data-screen/project_subway_station" 目录下的项目 "project_subway_station" 进行打包
# 打包命令: mvn clean package -Dmaven.test.skip=true# 上传 "project_subway_station/target/" 目录下的 "project_subway_station-jar-with-dependencies.jar" 文件 到 "/data/jobs/project/" 目录

mapreduce数据分析


cd /data/jobs/project/# 上传 "project-hive-mapreduce-subway-analysis-data-screen/project_subway_station" 目录下的 "run_mr.sh" 文件 到 "/data/jobs/project/" 目录sed -i 's/\r//g' run_mr.sh
bash run_mr.sh# 查看结果
hdfs dfs -ls /data/output/university_station_cities/
hdfs dfs -ls /data/output/max_stations_lines/
hdfs dfs -ls /data/output/most_frequent_chars/
hdfs dfs -ls /data/output/avg_stations_per_line/
hdfs dfs -ls /data/output/top_cities_by_lines/
hdfs dfs -ls /data/output/longest_station_names/

hive数据分析


cd /data/jobs/project/# 上传 "project-hive-mapreduce-subway-analysis-data-screen/project_subway_station" 目录下的 "hive.sql" 文件 到 "/data/jobs/project/" 目录# 连接进入hive终端命令如下:
# /export/software/apache-hive-3.1.2-bin/bin/beeline -u jdbc:hive2://master:10000 -n root# 快速执行hive.sql
hive -v -f hive.sql# 查看结果
hdfs dfs -ls /data/output/city_line_count/
hdfs dfs -ls /data/output/city_transfer_level/
hdfs dfs -ls /data/output/same_line_station_count_in_specific_cities/
hdfs dfs -ls /data/output/top_6_cities_by_transfer_stations/

启动可视化


cd /data/jobs/project/# 对 "project-hive-mapreduce-subway-analysis-data-screen/project_subway_station" 目录下的项目 "project_subway_station" 进行打包
# 打包命令: mvn clean package -Dmaven.test.skip=true# 上传 "project_subway_station/target/" 目录下的 "project_subway_station-jar-with-dependencies.jar" 文件 到 "/data/jobs/project/" 目录java -jar /data/jobs/project/springboot-demo-1.0-SNAPSHOT.jar org.example.SpringBootApplication
http://www.dtcms.com/a/409964.html

相关文章:

  • 使用虚幻引擎(UE5)制作开箱爆金币功能
  • 网站在线考试答题系统怎么做泰兴网页定制
  • 展示型商城订单网站建设网页设计网站方案
  • 【MySQL数据库】InnoDB实现MVCC(多版本并发控制)底层原理
  • 自己做网站推广关键词网站开发和合同
  • 【Qt开发】输入类控件(二)-> QTextEdit
  • 攻克音频顽疾:基于QCC3095/QCC5181/QCC3040实现全域无冲击声的实战分享
  • 视频融合平台EasyCVR构筑智慧交通可视化管理与智能决策中枢
  • 从特征到应用:用 dlib+OpenCV 实现实时疲劳检测(基于眼睛纵横比)
  • 【买机器人,上BFT】北京大学联合项目 论文解读 | H2R:一种用于机器人视频预训练的人机数据增强技术
  • 音频库管理在数字媒体中的应用探索
  • BLE配网协议 - 分包、组包和重传功能指南
  • MediaHuman YouTube to MP3 多语便携版:高效音频提取工具
  • Java 数组的定义与使用
  • 自建站有哪些站点wordpress前台压缩图片
  • R语言中的获取函数与替换函数
  • 微前端中iframe集成方式与使用微前端框架方式对比
  • 【NOI】在信奥赛中 什么是函数交互题?
  • 电脑上怎么做网站963中华室内设计网
  • Python调用优云智算安装的ComfyUI服务器
  • ACA云原生工程师认证知识点脑图
  • 用 Flink 打造事件驱动流式应用从 DataStream 到 ProcessFunction
  • MySQL学习笔记05:MySQL 索引原理与优化实战指南
  • 【提示工程】Ch2(续)-提示技术(Prompt Technique)
  • 嵌入式软件知识点汇总(day2)
  • QT中QStackedWidget控件功能及应用
  • 网络爬虫(上)
  • 论文精读(六):微服务系统服务依赖发现技术综述
  • 农业推广网站建设企业商城网站建设价格
  • 教师做班级网站手机网站打开微信号