Hive从入门到运用
hive简介

hive的设计思想(本质是一个翻译器)


上传安装包

解压,查看


运行hive(一定要启动hadoop,是有依赖关系的。)

测试启动方法,和建表
文件创建很上传到hdfs,直接上传到hive表的目录上去
创建一个文件,并在文件内写入数据。最后上传到hdfs


注意上传目录可以使用hive的目录


这样hive就有了这个文件

测试hive的查询

hive导入数据(load data 语句)

除了select * 以外其余的语句都会变成mapreduce。执行。

hive的表(内部表/外部表)
像我们自己用语句建立的表,存放在/user/hive/warehouse/**表,如此算是内部表。


例如下创建一个外部表



创建文件,做数据填充,检查数据


内部表和外部表的区别,内部表删除会直接删除,数据也会直接删除,但是外部表删除后只是把原数据库的的地址删除掉,但是hdfs的数据是不会删除的。


关联查询

结果如下

元数据库配置
这个元数据库是hive自带的,名字叫做derby数据库。只能单实例运行,如下

为了解决如果已经有客户端链接,就不能再次链接的问题,所以我们要求修改原数据库的配置
配置如下,进入conf文件夹,添加文件hive-site.xml

配置文件填充如下:切记将mysql的驱动配置一个到/lib下,否则mysql无法启动。


重启hive,将数据源改变为mysql。
看都看了,点个关注呗!

