spark Executor啟動過程分析

本篇文章將以問答的方式對executor的啟動進行分析。

首先會尋找可用的 worker 節點來啟動 executor ，所謂可用就是前面提到的executor在worker上啟動的條件

worker 節點資源分配是按照如下規則進行的：

過濾不可用的work，輪詢可用的work

分配給 executor 所需的 cpu 核數,即你指定的--executor-cores, 以及記憶體,即你指定的--executor-memory，

如果spark.deploy.spreadout指定為true,在進行一次分配後將繼續分配下乙個可用的work。否則，會繼續在該 work 上進行資源分配，直到該work資源全部分配完。才會繼續去尋找下乙個可用work

重複1 到 3.直到滿足該任務需要的資源，或者集群資源消耗完。

在某一集群中有4 個 worker 節點，每個節點擁有16個 cpu 核數，其中設定了spark.cores.max = 48和spark.executor.cores = 16, 如果spark.deploy.spreadout = true，按照每次分配 1 個cpu 核數，則每個 worker 節點的 executor 將分配到 12 個 cpu 核數，就達到了應用限制的最大核數48, 但卻沒有滿足executor啟動的最小cores 16，所以將沒有 executor 能夠啟動，參見 spark -8881問題說明。而在後續版本中，每次分配 cpu 核數為 executor 指定的 cpu 核數，如果沒有指定預設情況為1，這樣在前面的例子中，按照該分配方式將在3 個 worker 節點中的 executor 分配16個 cpu 核數，這樣就能夠正常啟動 executor 。

通過以上幾個問題，大概也能了解到 executor 在worker端啟動的整個流程了，本文主要是從原始碼角度挖掘的資訊，如有不對的地方，麻煩指出，謝謝！

spark Executor啟動過程分析

Spark Executor 執行Task的過程

冷啟動熱啟動

啟動mysql 啟動 MySQL

spark Executor啟動過程分析

Spark Executor 執行Task的過程

冷啟動 熱啟動

啟動mysql 啟動 MySQL

相關推薦

冷啟動熱啟動