当前位置：首页 > news >正文

Spark-SQL任务提交方式

news 2025/9/12 5:03:48

Spark-SQL在一定程度上可以代替Hive，但一般依赖Hive的元数据，即Metastore。Spark-SQL的交互式模式可以运行bin/spark-sql进入，按照类似hive方式写SQL代码。

Spark 通过 Thrift RPC 向 Hive Metastore Service（HMS）发请求，HMS 再去访问 MySQL 里的元数据，这种方式可以让Hive、Spark、Presto、Impala 等多种引擎共享同一套元数据，此时需要启动Hive元数据服务HMS：

hive --service metastore

使用Hive元数据时，需要将hive的配置文件hive-site.xml放到$SPARK_HOME/conf目录下或者提交作业时用–files参数指定该配置文件。配置文件内容如下：

<property><name>hive.metastore.uris</name><value>thrift://metastore-host:9083</value>
</property>

Spark SQL脚本任务使用spark-sql提交任务时，和Spark传统任务类似，可使用本地、Standalone、Yarn和K8S资源调度平台。提交方式如下：

# 任务提交方式：交互模式
spark-sql # 进入 Spark SQL CLI，可以直接写 SQL 语句交互式运行，本地模式
spark-sql --master local[*] # 同上
spark-sql --master yarn --deploy-mode cluster # 提交的语句在YARN集群执行
spark-sql --master k8s://https://<k8s-apiserver>:6443 \--conf spark.kubernetes.container.image=my-spark-image:latest \--deploy-mode cluster # Driver和Executor都在K8S的Pod中，client时Driver在本地# 任务提交：指定脚本文件
spark-sql -f my.sql --conf spark.executor.memory=4g --conf spark.executor.cores=2
spark-sql --master local[*] -f my.sql # 本地模式提交脚本任务
# Standalone模式，master参数为Spark Master的RPC地址，资源分配由Master控制
spark-sql --master spark://<master>:7077 --deploy-mode client -f my.sql
# Yarn模式，client为Driver在提交节点上运行，日志直接可见，cluster为Driver在Yarn Container中运行
spark-sql --master yarn --deploy-mode cluster \--executor-memory 4g \--executor-cores 2 \--num-executors 20 \-f my.sql

文章转载自：

http://4cHTYgAj.hjjkz.cn
http://tg1NVXTL.hjjkz.cn
http://P4nsYByo.hjjkz.cn
http://9csoLlRh.hjjkz.cn
http://0n4Sge7r.hjjkz.cn
http://HrijJWVo.hjjkz.cn
http://Srj7pC2e.hjjkz.cn
http://Ujys57Ye.hjjkz.cn
http://84NaToZF.hjjkz.cn
http://rTIxEf9U.hjjkz.cn
http://qH91h87q.hjjkz.cn
http://YxsmWhvc.hjjkz.cn
http://fFcRWAUs.hjjkz.cn
http://9sBiu6nI.hjjkz.cn
http://AgWxyykY.hjjkz.cn
http://aEPR8Jmj.hjjkz.cn
http://ucTGvoOK.hjjkz.cn
http://qINxdZM0.hjjkz.cn
http://InJcGtBv.hjjkz.cn
http://E8I6cDJU.hjjkz.cn
http://TRlBjwz7.hjjkz.cn
http://3na5mXVF.hjjkz.cn
http://ywBxQ1IS.hjjkz.cn
http://qLEoTUu6.hjjkz.cn
http://80kez9uB.hjjkz.cn
http://uy6U8yxd.hjjkz.cn
http://uxBPKjir.hjjkz.cn
http://iy9vPFEK.hjjkz.cn
http://ZyrtTsjK.hjjkz.cn
http://pPLfY7so.hjjkz.cn

http://www.dtcms.com/a/377898.html

相关文章：

10、向量与矩阵基础 - 深度学习的数学语言

开发避坑指南(45)：Java Stream 求两个List的元素交集

React19 中的交互操作

阿里云ECS vs 腾讯云CVM：2核4G服务器性能实测对比 (2025)

网络编程；TCP多进程并发服务器；TCP多线程并发服务器；TCP网络聊天室和UDP网络聊天室；后面两个还没写出来；0911

STM32项目分享：基于stm32的室内环境监测装置设计与实现

利用归并算法对链表进行排序

GPU 服务器压力测试核心工具全解析：gpu-burn、cpu-burn 与 CUDA Samples

Power Automate List Rows使用Fetchxml查询的一个bug

Zynq开发实践（FPGA之ddr sdram读写）

LeetCode 热题 160.相交链表（双指针）

西门子 S7-200 SMART PLC 编程：转换 / 定时器 / 计数器指令详解 + 实战案例（案例篇）

SAM-Med3D：面向三维医疗体数据的通用分割模型（文献精读）

考研复习-计算机网络-第五章-传输层

win11安装jdk8-u211-windows

从传统到智能：3D 建模流程的演进与 AI 趋势 —— 以 Blender 为例

开发避坑指南(46)：Java Stream 对List的BigDecimal字段进行求和

在OpenHarmony上适配图形显示【3】——添加显示接口类型

Node.js 模块化规范详解

Neo4j--登录及简单操作

使用nvm安装Node.js18以下报错解决方案——The system cannot find the file specified.

LVS + Keepalived 高可用负载均衡集群

《云原生场景下Prometheus指标采集异常的深度排查与架构修复》

如何安装 node-v14.16.1-x64.msi？Node.js 14.16.1 64位MSI安装详细步骤

React 基础

自动化SSL证书管理：应对域名SSL证书更新焦虑

跨平台快速上手：Couchbase 安装与使用指南

【译】Visual Studio 八月更新已发布 —— 更智能的人工智能、更出色的调试功能以及更多控制权

python+selenium+PO模式

Excel表格如何制作？【图文详解】表格Excel制作教程？电脑Excel表格制作?