当前位置: 首页 > news >正文

Spark-SQL任务提交方式

Spark-SQL在一定程度上可以代替Hive,但一般依赖Hive的元数据,即Metastore。Spark-SQL的交互式模式可以运行bin/spark-sql进入,按照类似hive方式写SQL代码。

Spark 通过 Thrift RPC 向 Hive Metastore Service(HMS) 发请求,HMS 再去访问 MySQL 里的元数据,这种方式可以让Hive、Spark、Presto、Impala 等多种引擎共享同一套元数据,此时需要启动Hive元数据服务HMS:

hive --service metastore

使用Hive元数据时,需要将hive的配置文件hive-site.xml放到$SPARK_HOME/conf目录下或者提交作业时用–files参数指定该配置文件。配置文件内容如下:

<property><name>hive.metastore.uris</name><value>thrift://metastore-host:9083</value>
</property>

Spark SQL脚本任务使用spark-sql提交任务时,和Spark传统任务类似,可使用本地、Standalone、Yarn和K8S资源调度平台。提交方式如下:

# 任务提交方式:交互模式
spark-sql # 进入 Spark SQL CLI,可以直接写 SQL 语句交互式运行,本地模式
spark-sql --master local[*] # 同上
spark-sql --master yarn --deploy-mode cluster # 提交的语句在YARN集群执行
spark-sql --master k8s://https://<k8s-apiserver>:6443 \--conf spark.kubernetes.container.image=my-spark-image:latest \--deploy-mode cluster # Driver和Executor都在K8S的Pod中,client时Driver在本地# 任务提交:指定脚本文件
spark-sql -f my.sql --conf spark.executor.memory=4g --conf spark.executor.cores=2
spark-sql --master local[*] -f my.sql # 本地模式提交脚本任务
# Standalone模式,master参数为Spark Master的RPC地址,资源分配由Master控制
spark-sql --master spark://<master>:7077 --deploy-mode client -f my.sql
# Yarn模式,client为Driver在提交节点上运行,日志直接可见,cluster为Driver在Yarn Container中运行
spark-sql --master yarn --deploy-mode cluster \--executor-memory 4g \--executor-cores 2 \--num-executors 20 \-f my.sql

文章转载自:

http://4cHTYgAj.hjjkz.cn
http://tg1NVXTL.hjjkz.cn
http://P4nsYByo.hjjkz.cn
http://9csoLlRh.hjjkz.cn
http://0n4Sge7r.hjjkz.cn
http://HrijJWVo.hjjkz.cn
http://Srj7pC2e.hjjkz.cn
http://Ujys57Ye.hjjkz.cn
http://84NaToZF.hjjkz.cn
http://rTIxEf9U.hjjkz.cn
http://qH91h87q.hjjkz.cn
http://YxsmWhvc.hjjkz.cn
http://fFcRWAUs.hjjkz.cn
http://9sBiu6nI.hjjkz.cn
http://AgWxyykY.hjjkz.cn
http://aEPR8Jmj.hjjkz.cn
http://ucTGvoOK.hjjkz.cn
http://qINxdZM0.hjjkz.cn
http://InJcGtBv.hjjkz.cn
http://E8I6cDJU.hjjkz.cn
http://TRlBjwz7.hjjkz.cn
http://3na5mXVF.hjjkz.cn
http://ywBxQ1IS.hjjkz.cn
http://qLEoTUu6.hjjkz.cn
http://80kez9uB.hjjkz.cn
http://uy6U8yxd.hjjkz.cn
http://uxBPKjir.hjjkz.cn
http://iy9vPFEK.hjjkz.cn
http://ZyrtTsjK.hjjkz.cn
http://pPLfY7so.hjjkz.cn
http://www.dtcms.com/a/377898.html

相关文章:

  • 10、向量与矩阵基础 - 深度学习的数学语言
  • 开发避坑指南(45):Java Stream 求两个List的元素交集
  • React19 中的交互操作
  • 阿里云ECS vs 腾讯云CVM:2核4G服务器性能实测对比 (2025)
  • 网络编程;TCP多进程并发服务器;TCP多线程并发服务器;TCP网络聊天室和UDP网络聊天室;后面两个还没写出来;0911
  • STM32项目分享:基于stm32的室内环境监测装置设计与实现
  • 利用归并算法对链表进行排序
  • GPU 服务器压力测试核心工具全解析:gpu-burn、cpu-burn 与 CUDA Samples
  • Power Automate List Rows使用Fetchxml查询的一个bug
  • Zynq开发实践(FPGA之ddr sdram读写)
  • LeetCode 热题 160.相交链表(双指针)
  • 西门子 S7-200 SMART PLC 编程:转换 / 定时器 / 计数器指令详解 + 实战案例(案例篇)
  • SAM-Med3D:面向三维医疗体数据的通用分割模型(文献精读)
  • 考研复习-计算机网络-第五章-传输层
  • win11安装jdk8-u211-windows
  • 从传统到智能:3D 建模流程的演进与 AI 趋势 —— 以 Blender 为例
  • 开发避坑指南(46):Java Stream 对List的BigDecimal字段进行求和
  • 在OpenHarmony上适配图形显示【3】——添加显示接口类型
  • Node.js 模块化规范详解
  • Neo4j--登录及简单操作
  • 使用nvm安装Node.js18以下报错解决方案——The system cannot find the file specified.
  • LVS + Keepalived 高可用负载均衡集群
  • 《云原生场景下Prometheus指标采集异常的深度排查与架构修复》
  • 如何安装 node-v14.16.1-x64.msi?Node.js 14.16.1 64位MSI安装详细步骤
  • React 基础
  • 自动化SSL证书管理:应对域名SSL证书更新焦虑
  • 跨平台快速上手:Couchbase 安装与使用指南
  • 【译】Visual Studio 八月更新已发布 —— 更智能的人工智能、更出色的调试功能以及更多控制权
  • python+selenium+PO模式
  • Excel表格如何制作?【图文详解】表格Excel制作教程?电脑Excel表格制作?