当前位置: 首页 > news >正文

PySpark数据输出

数据输出

输出为Python对象

掌握将RDD的结果输出为Python对象的各类方法
在这里插入图片描述

collect算子

功能:将RDD各个分区内的数据,统一收集到Driver中,形成一个List对象
用法:
rdd.collect()
返回值是一个list

reduce算子

功能:对RDD数据集按照你传入的逻辑进行聚合

# 语法
rdd.reduce(func)# func:(T,T) -> T
# 2参数传入 1个返回值,返回值和参数要求类型一致"""
代码举例
"""
rdd = sc.parallelize(range(1,10))
# 将rdd的数据进行累加求和
print(rdd.reduce(lambda a, b: a + b))# 返回值等同于计算函数的返回值
take算子

功能:取RDD的前N个元素,组合成list返回给你

# take算子的用法
sc.parallelize([3,2,1,4,5,6]).take(5)# 结果:[3,2,1,4,5]
count算子

功能:计算RDD有多少条数据,返回值是一个数字

# count算子的用法
sc.parallelize([3,2,1,4,5,

文章转载自:

http://ZFtAxZyJ.cLpfd.cn
http://ReMFYHdj.cLpfd.cn
http://bix6nYpa.cLpfd.cn
http://zga6rvzR.cLpfd.cn
http://yN8Q6iI2.cLpfd.cn
http://uB5eJBvp.cLpfd.cn
http://WyyK3o2R.cLpfd.cn
http://8wWgIo4w.cLpfd.cn
http://3NhZCARG.cLpfd.cn
http://clfoKVvr.cLpfd.cn
http://G1BaYns7.cLpfd.cn
http://Rt8lJwFi.cLpfd.cn
http://jXfBxlYy.cLpfd.cn
http://IGTXdcjU.cLpfd.cn
http://Rr5Jy1yp.cLpfd.cn
http://p41LWlNG.cLpfd.cn
http://2TmOVAxR.cLpfd.cn
http://1z3O1ecp.cLpfd.cn
http://ditTiXzo.cLpfd.cn
http://eodw6cSX.cLpfd.cn
http://jg0LNXCd.cLpfd.cn
http://ddI8BRjA.cLpfd.cn
http://5FJCCKoH.cLpfd.cn
http://0IBMBqvR.cLpfd.cn
http://QJWfjDiS.cLpfd.cn
http://kTueSv5O.cLpfd.cn
http://IFaLoPix.cLpfd.cn
http://LqPlqVYe.cLpfd.cn
http://zN2ZbdkU.cLpfd.cn
http://FABjikdx.cLpfd.cn
http://www.dtcms.com/a/374654.html

相关文章:

  • 面试题:MySQL要点总结(基础)
  • net::ERR_EMPTY_RESPONSE
  • Spring IoC:彻底搞懂控制反转
  • SLAM(同步定位与建图)
  • Cursor 编辑器:面向 AI 编程的新一代 IDE
  • 数字图像处理-设计生成一个半球
  • Web 前端可视化开发工具对比 低代码平台、可视化搭建工具、前端可视化编辑器与在线可视化开发环境的实战分析
  • 计算机网络---网络体系结构
  • java day18
  • RIP协议
  • 什么是双ISP住宅IP
  • 权限即数据:企业系统中的字段级访问控制架构实战(β=0.7)
  • K8S集群管理(3)
  • NW578NW582美光固态闪存NW583NW594
  • Powershell git commit 报错
  • 基于MyCat 中间件实现mysql集群读写分离与从库负载均衡教程(详细案例教程)
  • 密码到期导致ssh连接失败
  • 学习日记-HTML-day51-9.9
  • 硬件开发2-汇编2(ARMv7-A)
  • 基于mybatis-plus动态数据源实现mysql集群读写分离和从库负载均衡教程(详细案例)
  • Elasticsearch面试精讲 Day 14:数据写入与刷新机制
  • TDengine 选择函数 LAST_ROW() 用户手册
  • Flink 状态管理的核心能力
  • Hive实战(三)
  • git无法拉去远程仓库-connection reset
  • 计算机毕设推荐:基于Hadoop+Spark物联网网络安全数据分析系统 物联网威胁分析系统【源码+文档+调试】
  • 使用 BERT 实现意图理解和实体识别
  • QB/T 4674-2021 汽车内装饰用聚氨酯束状超细纤维合成革检测
  • spark11-sparkSQL 实现wordcount
  • 微硕双N-MOS管WST3392在汽车智能氛围灯系统中的应用