当前位置: 首页 > news >正文

在kali linux中配置hive(mysql元数据库)


一、MySQL 配置

1. 清除原有 MariaDB
# 删除原有的mariadb数据库,要不然安装mysql会有冲突
sudo apt remove --purge mariadb-* --fix-missing
# 清除相关文件
sudo apt autoremove -y
# 手动清除
sudo rm -rf /var/lib/mysql/
sudo rm -rf /etc/mysql/
2. 下载并安装 MySQL
# 下载mysql安装包,由于kali linux不支持从apt中下载mysql
sudo wget https://repo.mysql.com//mysql-apt-config_0.8.33-1_all.deb

# 添加mysql下载索引
sudo dpkg -i mysql-apt-config_0.8.33-1_all.deb
# 执行命令后出现安装界面选择ubuntu noble
# 选择mysql-8.4-lts版本

# 更新apt软件包索引
sudo apt update

# 下载mysql
sudo apt install mysql-community-server --fix-missing
# 下载完会出现root密码输入界面
3. 启动服务并创建 Hive 用户
# 开机自启
sudo systemctl enable mysql

# 启动服务
sudo systemctl start mysql
-- 登录 MySQL
sudo mysql -u root -p

-- 创建数据库和用户
CREATE DATABASE hive_metastore;
CREATE USER 'hiveuser'@'localhost' IDENTIFIED BY '123';
GRANT ALL PRIVILEGES ON hive_metastore.* TO 'hiveuser'@'localhost';
FLUSH PRIVILEGES;
EXIT;

二、Hive 配置

1. 下载解压 Hive
# 下载hive
sudo wget https://dlcdn.apache.org/hive/hive-4.0.1/apache-hive-4.0.1-bin.tar.gz
# 解压hive
sudo tar -xzvf apache-hive-4.0.1-bin.tar.gz
# 重命名hive
mv apache-hive-4.0.1-bin  hive-4.0.1                                  
2. 配置环境变量
# 编辑 ~/.bashrc
echo 'export HIVE_HOME=/soft/hive-4.0.1' >> ~/.zshrc
echo 'export PATH=$PATH:$HIVE_HOME/bin' >> ~/.zshrc
source ~/.zshrc
3. 配置 hive-site.xml和hive-env.sh
cd $HIVE_HOME/conf
cp hive-default.xml.template hive-site.xml

# 清空原内容并添加以下配置
cat > hive-site.xml <<EOF
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>

  <!-- 连接元数据库的配置 -->
  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://localhost:3306/hive_metastore?createDatabaseIfNotExist=true</value>
    <description>JDBC connect string for a JDBC metastore</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.cj.jdbc.Driver</value>
    <description>Driver class name for a JDBC metastore</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>hiveuser</value>
    <description>Username to use against metastore database</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>123</value>
    <description>Password to use against metastore database</description>
  </property>

  <!-- Hive数据在HDFS上的存储路径 -->
  <property>
    <name>hive.metastore.warehouse.dir</name>
    <value>/user/hive/warehouse</value>
    <description>Location of default database for the warehouse</description>
  </property>

  <!-- Hive临时目录配置 -->
  <property>
    <name>hive.exec.scratchdir</name>
    <value>/user/hive/tmp</value>
  </property>
</configuration>
EOF
cp hive-env.sh.template hive-env.sh 

echo 'export HADOOP_HOME=/soft/hadoop-3.4.1/ ' >> ./hive-env.sh 
echo 'export HIVE_CONF_DIR=/soft/hive-4.0.1/conf/' >> ./hive-env.sh 
4. 安装 MySQL JDBC 驱动
# 查看驱动安装包
sudo apt list | grep mysql
# 下载驱动
sudo apt install mysql-connector-j
# 将驱动包复制到$HIVE_HOME/lib下(/usr/share/java/)
# or使用updatedb→locate 文件名
# or使用sudo find / -name 文件名
cp /usr/share/java/mysql-connector-j-9.2.0.jar $HIVE_HOME/lib

5. 指定代理用户
# 进入hadoop的core-site.xml文件添加以下内容
# 目的是能安全正常连接beeline并使用
  <property>
    <name>hadoop.proxyuser.wgs.hosts</name>
    <value>*</value> <!-- HiveServer2 所在主机,* 表示所有 -->
  </property>
  <property>
    <name>hadoop.proxyuser.wgs.groups</name>
    <value>*</value> <!-- 允许代理的用户组,* 表示所有 -->
  </property>
  <property>
    <name>hadoop.proxyuser.wgs.users</name>
    <value>*</value> <!-- 允许代理的具体用户,* 表示所有(含 wgs) -->
  </property>

三、Hadoop 服务启动

# 启动 Hadoop 集群(需已安装 Hadoop)
start-dfs.sh
start-yarn.sh

# 创建目录为hive存放数据
hdfs dfs -mkdir -p /user/hive/warehouse
hdfs dfs -mkdir -p /user/hive/tmp

四、初始化与启动

# 初始化元数据库
schematool -dbType mysql -initSchema

# 启动 Hive 服务
hiveserver2

# 连接beeline
beeline -u jdbc:hive2://hadoop:10000 -n wgs

五、测试验证

-- 在 Hive CLI 中执行
SHOW DATABASES;
CREATE TABLE test(id INT);
INSERT INTO test VALUES(1);
SELECT * FROM test;

相关文章:

  • 现阶段高校的人工智能方案培训如何?
  • MVC基础概念及相应代码示例
  • Nextjs15 - middleware的使用
  • LeetCode算法题(Go语言实现)_11
  • (每日一道算法题) K 个一组翻转链表
  • 2025宠物智能喂养设备全栈开发方案:Python驱动的高效实现路径
  • IntelliJ IDEA创建Maven工程
  • Ardupilot开源无人机之Geek SDK进展2025Q2
  • 我的世界1.20.1forge模组进阶开发教程——结构(3)
  • 华为 eNSP 链路聚合:从面试问题到实战解析
  • MySQL数据库精研之旅第四期:解锁库操作高阶技能
  • Python数据可视化与数据处理全解析:Matplotlib图形控制与Pandas高效数据分析实战
  • MySQL中的Redo Log、Undo Log和Binary Log
  • 大模型在支气管肺癌预测及临床决策中的应用研究报告
  • 蓝桥杯 临时抱佛脚 之 二分答案法与相关题目
  • 【设计模式】抽象工厂模式(含与工厂方法模式的对比)
  • Unity-RectTransform设置UI width
  • wokwi arduino mega 2560 - 模数与数模转换AD和DA
  • 设置git拉取的文件换行格式
  • Codeforces Round 1013 (Div. 3)
  • 涨知识|没想到吧,体育老师强调的运动恢复方法是错的?
  • 近4小时会谈、3项联合声明、20多份双边合作文本,中俄元首今年首次面对面会晤成果颇丰
  • 国新办将于5月8日10时就《民营经济促进法》有关情况举行新闻发布会
  • 上海虹桥机场至北京首都机场快线试运行跨航司自愿签转服务
  • 伊朗公布新型弹道导弹,“萨德”系统无法拦截
  • 俄罗斯期望乌克兰在停火期间采取行动缓和局势