YARN與MapReduce的區別

2021-07-26 07:27:46 字數 540 閱讀 1486

首先介紹一下老的mapreduce的機制,老的mapreduce的具體流程如下,

jobclient提交job給job tracker,job tracker與集群所有機器通訊(heartbeat),管理所有job失敗、重啟等操作。task tracker是在每一台機器上都有的,主要用來監視自己所在機器的task運**況及機器的資源情況,然後把這些資訊通過heartbeat傳送給job tracker。

mapreduce存在的問題:

1 job tracker 存在單點故障

2 job tracker 完成太多工,當mr任務非常多時,造成很大的記憶體開銷

3 task tracker 端,如果兩個大記憶體消耗的任務一起排程,容易出現oom,如果只有map任務或reduce任務時會造成資源浪費

MapReduce提交job到Yarn的流程學習

6 在客戶端執行乙個mapreduce程式時,能看到map和reduce任務執行的進度百分比,這個是am在執行initialize job後建立的薄記物件完成的,這個薄記物件會收集執行在分布式各個節點上任務的進度,彙總後定時傳送給client。7 在執行mapreduce程式時,會先執行map任務然...

MapReduce框架在Yarn上的詳解

在yarn 上乙個mapreduce 任務叫做乙個 job。乙個 job的主程式在 mapreduce 框架上實現的應用名稱叫 這是乙個mapreduce 為提高shuffle 效率reduce 階段會在 map階段結束之前就開始。直到所有 maptask 完成之後 reducetask 才能完成,...

MapReduce框架在Yarn上的具體解釋

在yarn 上乙個mapreduce 任務叫做乙個 job。乙個job 的主程式在 mapreduce 框架上實現的應用名稱叫 這是乙個mapreduce 為提高shuffle 效率reduce 階段會在 map階段結束之前就開始。直到全部 maptask 完畢之後 reducetask 才幹完畢。...