Spark 基礎 重試級別及說明

2021-10-25 06:15:56 字數 1018 閱讀 1997

目錄

2 級別二: executor 重試

3 級別三:stage 重試

4 級別三:task 重試

作用:避免 job 失敗一次後,就馬上 stop。

引數:yarn.resourcemanager.am.max-attempts:預設為 2

類裡面:

引數:spark.yarn.max.executor.failures= max(numexecutors * 2 ,  3)

說明:如果 executor failed 一定數量後,整個 spark 任務就會kill 掉。

引數:spark.stage.maxconsecutiveattempts=預設為 4

說明:在乙個 stage 被中止之前,允許的連續 stage 重試的次數

引數:spark.task.maxfailures= 預設為 4次,允許重試次數=此值-1。

說明:task 重啟次數超過spark.task.maxfailures,則 taskset 會失敗,即乙個 stage 失敗。stage 失敗導致整個 job 就失敗了,spark 會取消該 stage 對應的 job 包含的所有 task,並返回使用者任務執行失敗。

簡述Spark基礎及架構

五 spark資料核心 rdd 六 建立rdd spark是基於記憶體的分布式計算框架,特點是快速 易用 通用及多種執行模式。spark架構主要由以下元件構成 cluster manager 在集群 standalone mesos yarn 上獲取資源的外部服務 task 被送到某個 execut...

Spark快取策略說明及選擇

提高rdd的使用效率。spark快取策略示例 不需要快取 引數 usedisk,usememory,useoffheap,deserialized,replication 預設值為1 1.disk only 引數 usedisk,usememory,useoffheap,deserialized,r...

Spark 基礎及RDD基本操作

什麼是rdd rdd resilient distributed dataset 叫做分布式資料集,是spark中最基本的資料抽象,它代表乙個不可變 可分割槽 裡面的元素可平行計算的集合。rdd具有資料流模型的特點 自動容錯 位置感知性排程和可伸縮性。rdd允許使用者在執行多個查詢時顯式地將工作集快...