spark運算元 五 action運算元

2021-10-09 17:17:44 字數 591 閱讀 5797

collect

package com.doit.spark.demoday05

import org.apache.spark.sparkcontext

/** * @author 向陽木

* @date 2020/09/22/ 22:19

* @description:

* 將資料以陣列形式收集回driver端,資料按照分割槽編號有序返回

* 按照分割槽編號收集到記憶體中,記憶體中有乙個閾值,達到上限後,便不會收集

*/object collectdemo

}

actiondemo

package com.doit.spark.demoday05

import org.apache.spark.sparkcontext

/** * @author 向陽木

* @date 2020/09/22/ 22:26

* @description:

*/object actiondemo )}

}

Spark常用運算元 action

spark action常用運算元型別如下 1.collectasmap map k,v 二元組rdd轉為map資料型別 countbykey map k,long 統計rdd中每個key出現的次數,還回map型別表示每個key出現了幾次 countbyvalue map t,long 統計rdd中...

Action行動運算元

常用運算元 count 返回資料集中的元素數。會在結果計算完成後 到driver端 take n 返回乙個包含資料集前n個元素的集合 first first take 1 返回資料集中的第乙個元素 foreach 迴圈遍歷資料集中的每個元素,執行相應的邏輯 collect 將計算結果 到driver...

Spark運算元詳解

目錄 spark常用運算元詳解 3.getnumpartitions 4.partitions 5.foreachpartition 6.coalesce 7.repartition 8.union,zip,join 9.zipwithindex,zipwithuniqueid 未完待續.本文主要介...