Spark,RDD中的行动算子
RDD中的行动算子
collect算子
格式:def collect(): Array[T]
参数说明:该算子没有参数。
并以数组的形式返回
统计个数
reduce算子
格式:def reduce(func: (T, T) => T): T
返回值:返回一个单一的值,其类型与 RDD 中元素的类型相同。
count,聚合操作 eg:计算rdd中的元素之和
foreach算子
格式:def foreach(f: T => Unit): Unit
返回值:该算子的返回类型为 Unit,即不返回任何有意义的值,它主要是为了执行副作用操作。
遍历操作