Spark on Yarn客戶端作業提交過程分析

我們將以乙個spark streaming為例,閱讀spark相關原始碼，簡述spark on yarn客戶端模式下作業提交流程。作業是通過spark-submit指令碼提交的，因此整個流程從spark-submit**開始分析。若有錯誤，希望各位看官指出。

通過submit獲取提交**的mainclass通過反射機制utils.classforname建立相關的類,並獲取其中的mainmethod通過反射呼叫直接呼叫上一步獲得的mainmethod,開始執行作業的main方法

把sparkconf和批處理間隔做給引數建立乙個streamingcontext類

createsparkenv

以sparkconf和listenerbus為引數呼叫createsparkenv函式。其中，listenerbus是spark中的***，包括jobprogresslistener。在createsparkenv呼叫的過程中，將呼叫sparkenv物件的createdriverenv成員函式，在這個過程中會建立乙個actorsystem和乙個rpcenv，生成乙個driver，這將建立乙個sparkenv物件，sparkenv物件中將封裝諸如rpcenv，actorsystem，cachemanager，mapoutputtracker，shufflemanager，broadcastmanager，blockmanager，memorymanager等成員類，成員類的作用如下：

heartbeatreceiver

執行在driver上的乙個類，負責接受來自executor的心跳資訊。

以clientarguements為引數，新建乙個client類

reference

Spark on Yarn客戶端作業提交過程分析

瘦客戶端胖客戶端智慧型客戶端

胖客戶端瘦客戶端和富客戶端

非同步客戶端和同步客戶端

Spark on Yarn客戶端作業提交過程分析

瘦客戶端 胖客戶端 智慧型客戶端

胖客戶端 瘦客戶端和富客戶端

非同步客戶端和同步客戶端

相關推薦

瘦客戶端胖客戶端智慧型客戶端

胖客戶端瘦客戶端和富客戶端