Hadoop中Map任務的執行框架

類吧。

關於上面我抽象出來的這個map任務執行框架，還需要補充的是，在map任務對應的上下文執行環境context中有個任務報告器taskreporter，它被用來不斷的向這個map任務的tasktracker報告任務的執行進度(這個精度只是乙個估計值，不一定很準確)。另外，有人可能會問這個map任務的輸入檔案和結果輸出檔案的有關資訊context是如何獲悉的？其實，map任務的輸入檔案檔案儲存在inputsplit中，這個inputsplit儲存了檔案的路徑、範圍、位置；map任務的輸出檔案資訊是在執行過程中動態生成的，因為map任務的結果輸出實際上就是reduce任務的輸入，它相當於只是全域性作業中的乙個中間過程，所以這個map任務的輸出

結果的儲存對於使用者來說是透明的，而使用者往往也只關心reduce任務的最後彙總結果。

下面再來看看這個框架具體的執行步驟：

本文所介紹的只是抽象的map任務執行框架，至於mapreduce內部是如何具體實現的，我還會在以後進行詳細的闡述。(上文都是本人的一些個人見解，若有不當或錯誤之處盡請指出，以便幫助我學習進步，謝謝！)

Hadoop中Map任務的執行框架

hadoop 任務執行優化

hadoop 控制map任務數詳解

Hadoop的MR程式中map的個數

Hadoop中Map任務的執行框架

hadoop 任務執行優化

hadoop 控制map任務數詳解

Hadoop的MR程式中map的個數

相關推薦