当前位置: 首页 > news >正文

Hive从入门到运用

hive简介

hive的设计思想(本质是一个翻译器)

上传安装包

解压,查看

运行hive(一定要启动hadoop,是有依赖关系的。)

测试启动方法,和建表

文件创建很上传到hdfs,直接上传到hive表的目录上去

创建一个文件,并在文件内写入数据。最后上传到hdfs

注意上传目录可以使用hive的目录

这样hive就有了这个文件

测试hive的查询

hive导入数据(load data 语句)

除了select * 以外其余的语句都会变成mapreduce。执行。

hive的表(内部表/外部表)

像我们自己用语句建立的表,存放在/user/hive/warehouse/**表,如此算是内部表。

例如下创建一个外部表

创建文件,做数据填充,检查数据

内部表和外部表的区别,内部表删除会直接删除,数据也会直接删除,但是外部表删除后只是把原数据库的的地址删除掉,但是hdfs的数据是不会删除的。

关联查询

结果如下

元数据库配置

这个元数据库是hive自带的,名字叫做derby数据库。只能单实例运行,如下

为了解决如果已经有客户端链接,就不能再次链接的问题,所以我们要求修改原数据库的配置

配置如下,进入conf文件夹,添加文件hive-site.xml

配置文件填充如下:切记将mysql的驱动配置一个到/lib下,否则mysql无法启动。

重启hive,将数据源改变为mysql。

看都看了,点个关注呗!

相关文章:

  • 使用 Apache Dubbo 释放 DeepSeek R1 的全部潜力
  • DeepSeek 开源了 DeepEP
  • 单片机病房呼叫系统设计
  • 数据开发的简历及面试
  • 程序诗篇里的灵动笔触:指针绘就数据的梦幻蓝图
  • SV——Clocking block的应用
  • Spring Boot2.0之十 使用自定义注解、Json序列化器实现自动转换字典类型字段
  • 【Linux】Linux常用命令
  • Spring Boot 项目中如何在 `pom.xml` 文件中引入本地 JAR 包
  • 「JVS更新日志」低代码、企业会议、智能BI、智能排产2.26更新说明
  • 使用TortoiseGit配合BeyondCompare实现在Git仓库中比对二进制文件
  • QML Text部件的使用
  • JavaScript系列(90)--前端脚手架开发
  • 用Golang与WebAssembly构建高性能Web应用:详解`syscall/js`包
  • 大语言加持的闭环端到端自动驾驶模型 学习笔记纯干货
  • Linux:权限
  • pyrender 自动计算相机 pose
  • 机器学习——李航(实验)笔记第一二章
  • 电子元器件识别图大全、符号对照表
  • 【TCAD】Sentaurus 中的“陷阱trap”仿真设置
  • 国务院关税税则委员会关于调整对原产于美国的进口商品加征关税措施的公告
  • 一海南救护车在西藏无任务拉警笛开道,墨脱警方:已处罚教育
  • 欧阳娜娜携家人回江西探亲,受聘为江西吉安文化旅游大使
  • 乘联分会:上半年车市价格竞争温和,下半年价格战或再开启
  • 汇源果汁发文:经营情况一切正常
  • 王毅同印度国家安全顾问多瓦尔通电话