当前位置：首页 > news >正文

Hive从入门到运用

news 2025/10/28 19:32:35

hive简介

hive的设计思想（本质是一个翻译器）

上传安装包

解压，查看

运行hive（一定要启动hadoop，是有依赖关系的。）

测试启动方法，和建表

文件创建很上传到hdfs，直接上传到hive表的目录上去

创建一个文件，并在文件内写入数据。最后上传到hdfs

注意上传目录可以使用hive的目录

这样hive就有了这个文件

测试hive的查询

hive导入数据（load data 语句）

除了select * 以外其余的语句都会变成mapreduce。执行。

hive的表（内部表/外部表）

像我们自己用语句建立的表，存放在/user/hive/warehouse/**表，如此算是内部表。

例如下创建一个外部表

创建文件，做数据填充，检查数据

内部表和外部表的区别，内部表删除会直接删除，数据也会直接删除，但是外部表删除后只是把原数据库的的地址删除掉，但是hdfs的数据是不会删除的。

关联查询

结果如下

元数据库配置

这个元数据库是hive自带的，名字叫做derby数据库。只能单实例运行，如下

为了解决如果已经有客户端链接，就不能再次链接的问题，所以我们要求修改原数据库的配置

配置如下，进入conf文件夹，添加文件hive-site.xml

配置文件填充如下：切记将mysql的驱动配置一个到/lib下，否则mysql无法启动。

重启hive，将数据源改变为mysql。

看都看了，点个关注呗！

http://www.dtcms.com/a/38722.html

相关文章：

使用 Apache Dubbo 释放 DeepSeek R1 的全部潜力

DeepSeek 开源了 DeepEP

单片机病房呼叫系统设计

数据开发的简历及面试

程序诗篇里的灵动笔触：指针绘就数据的梦幻蓝图

SV——Clocking block的应用

Spring Boot2.0之十使用自定义注解、Json序列化器实现自动转换字典类型字段

【Linux】Linux常用命令

Spring Boot 项目中如何在 `pom.xml` 文件中引入本地 JAR 包

「JVS更新日志」低代码、企业会议、智能BI、智能排产2.26更新说明

使用TortoiseGit配合BeyondCompare实现在Git仓库中比对二进制文件

QML Text部件的使用

JavaScript系列（90）--前端脚手架开发

用Golang与WebAssembly构建高性能Web应用：详解`syscall/js`包

大语言加持的闭环端到端自动驾驶模型学习笔记纯干货

Linux：权限

pyrender 自动计算相机 pose

机器学习——李航（实验）笔记第一二章

电子元器件识别图大全、符号对照表

【TCAD】Sentaurus 中的“陷阱trap”仿真设置

对象存储之Ceph

halcon三维点云数据处理（二十八）reconstruct_3d_object_model_for_matching

笔记20250226

Ubuntu22中的bash脚本记录

【Linux 进程状态】—— 从创建到消亡的全生命周期

QT初学——helloworld

魔法方法：__str__( )

uniapp 小程序如何实现大模型流式交互？前端SSE技术完整实现解析

【图像的读写与基本操作】

C#调用CANoeCLRAdapter.dll文章（一）