当前位置: 首页 > news >正文

spark-AQE/Tungsten介绍及其触发条件

目录

    • 1、简介
    • 2、AQE(自适应查询优化)触发条件及配置
    • 3、Tungsten(钨丝计划)触发条件及配置

1、简介

  1. AQE(Adaptive Query Execution)

    • 定义:Spark 3.0引入的自适应查询优化技术运行时动态调整执行计划
    • 核心能力
      • 动态分区合并:自动合并小分区以减少Shuffle数据量。
      • 自动Broadcast Join:根据数据量动态切换Join策略。
      • Skew Join优化:识别数据倾斜并自动调整分区策略。
    • 配置参数
      spark.sql.adaptive.enabled=true
      spark.sql.adaptive.skewJoin.enabled=true
      
  2. Tungsten(钨丝计划)

    • 定义:Spark 1.6推出的底层性能优化框架,通过内存管理和代码生成提升效率。
    • 关键技术
      • 内存列式存储:减少内存占用并提升缓存利用率。
      • 代码生成(Codegen):动态生成JVM字节码替代解释执行。
      • Sort-Based Shuffle优化:基于内存的排序减少磁盘I/O。
    • 触发条件:需满足特定配置(如spark.sql.shuffle.partitions设置合理)。

2、AQE(自适应查询优化)触发条件及配置

  • 生效条件

    • Spark 3.0+ 版本,且作业中至少存在一次 Shuffle 操作。
    • 需通过以下参数显式启用:
      set

相关文章:

  • 手机打电话时将对方DTMF数字转为RFC2833发给局域网SIP坐席
  • MongoDB(七) - MongoDB副本集安装与配置
  • 性能优化深度实践:突破vue应用性能
  • 机器学习数据降维方法
  • 【论文解读】DETR: 用Transformer实现真正的End2End目标检测
  • 【2025文博会现场直击】多图预警
  • WSL 开发环境搭建指南:Java 11 + 中间件全家桶安装实战
  • 甘特图 dhtmlxGantt.js UA实例
  • LVS-Keepalived高可用群集
  • 3D PDF如何制作?SOLIDWORKS MBD模板定制技巧
  • LVS+Keepalived高可用集群
  • Opencv实用操作6 开运算 闭运算 梯度运算 礼帽 黑帽
  • LVS+Keepalived高可用群集
  • 2025年- H57-Lc165--994.腐烂的橘子(图论,广搜)--Java版
  • 代码随想录打卡|Day50 图论(拓扑排序精讲 、dijkstra(朴素版)精讲 )
  • CentOS_7.9 2U物理服务器上部署系统简易操作步骤
  • 园区智能化集成平台汇报方案
  • 【C语言极简自学笔记】项目开发——扫雷游戏
  • 时序数据库IoTDB基于云原生的创新与实践
  • 【测试】Bug和用例
  • 电商网站开发步骤/seo网站推广的主要目的是什么
  • 企术建站/免费模板网站
  • 花钱做网站注意些什么/淘宝营销推广方案
  • 中国电力建设股份有限公司网站/营销失败案例分析
  • 城乡建设与环保部网站/一键免费建站
  • 广东建设工程监理检测协会网站/免费行情软件网站下载大全