当前位置: 首页 > news >正文

Spark-SQL2

利用IDEA开发Spark-SQL

自定义函数

UDF:

 

UDAF(自定义聚合函数)

强类型的 Dataset 和弱类型的 DataFrame 都提供了相关的聚合函数, 如 count(),countDistinct(),avg(),max(),min()。除此之外,用户可以设定自己的自定义聚合函数。Spark3.0之前我们使用的是UserDefinedAggregateFunction作为自定义聚合函数,从 Spark3.0 版本后可以统一采用强类型聚合函数 Aggregator。

举例方案:计算平均工资

实现方式一:RDD

实现方式二:弱类型UDAF

实现方式三:强类型UDAF

 

 

 

相关文章:

  • OpenCV中的轮廓近似方法详解
  • MCP Server 开发实战 | 大模型无缝对接 Grafana
  • 49、发起流式请求获取回答
  • Jarpress 开源项目重构公告
  • Java设计模式之观察者模式:从入门到架构级实践
  • 安卓基础(SQLite)
  • 设计模式之状态模式:优雅管理对象行为变化
  • 最简单的使用SDL2 播放原始音频数据程序
  • KrillinAI:视频跨语言传播的一站式AI解决方案
  • js原型链污染
  • 使用 LLaMA-Factory 对 DeepSeek R1进行微调教程
  • Docker--Docker镜像原理
  • PHP4 Session定制与使用指南
  • 部署LLaMA Factory,及快速使用
  • 3DGS之渲染管线
  • 天元证券|8家汽车零部件上市公司一季度业绩预喜
  • [特殊字符] LoRA微调大模型实践:从MAC到Web的全流程指南
  • SGFormer:卫星-地面融合 3D 语义场景补全
  • 大模型预标注和自动化标注在OCR标注场景的应用
  • http、https、TLS、证书原理理解,对称加密到非对称加密问题,以及对应的大致流程
  • 98岁动物学家、北京大学教授杨安峰逝世
  • 金融监管总局:近五年民企贷款投放年平均增速比各项贷款平均增速高出1.1个百分点
  • 圆桌丨中俄权威专家详解:两国携手维护战后国际秩序,捍卫国际公平正义
  • 上海:5月8日起5年以上首套个人住房公积金贷款利率下调至2.6%
  • 印巴局势快速升级,外交部:呼吁印巴以和平稳定的大局为重
  • 习近平在俄罗斯媒体发表署名文章