MapReduce架構設計

2021-08-21 07:22:14 字數 1348 閱讀 1052

mapreduce

map    對映函式

reduce 規約函式

在hadoop1.x mr1中(計算+資源作業排程)分為

在hadoop2.x mr2中 計算  資源作業排程-->yarn(資源管理和作業排程放到了yarn平台)

1.不需要部署元件

2.架構設計(面試題)

--》mr job提交到yarn的工作流程--》yarn的架構設計、yarn的工作流程

3.架構設計

container: 容器的意思,屬於yarn的元件 將一定的記憶體1g cpu 1core等資源抽象成乙個小房間,用於執行任務。

假如機器的物理配置為64g 16cores:  * 一般來說使用75-85%的資源,剩餘一部分用於機器的基本工作。

yarn拿到的資源: 64*0.8   16*0.8

container:

yarn.nodemanager.resource.memory-mb:64*0.8g≈50g

yarn.scheduler.minimum-allocation-mb: 1g

yarn.scheduler.maximum-allocation-mb: 1g   50/1=50 假如設定最大使用1g,則有50個容器,數量是多了,並行度大了 

優缺點:乙個作業200 maptask 4輪結束,速度快了  作業可能掛了

yarn.scheduler.maximum-allocation-mb: 16g   50/16≈3

假如設定最大使用16g,則有3個容器,數量是少了,並行度小了 

優缺點:乙個作業200 maptask 70輪才能結束,速度慢了  作業時間長

yarn.nodemanager.resource.memory-mb

yarn.scheduler.minimum-allocation-mb        1024     預設值1g

yarn.scheduler.maximum-allocation-mb        8192    預設最大8g

yarn.scheduler.minimum-allocation-vcores 1        

yarn.scheduler.maximum-allocation-vcores 4

虛擬core 1:2 =32 vcore(16*2)

salesforce 架構設計 從架構設計到架構師

因為碎片化的時間多了,所以開始刷起某乎了,關注了架構相關的板塊,也順手回答了一些問題。發現有很多同道中人正在經歷著我前兩年經歷的階段,對於做架構沒有相對具象的一些理解,更沒有系統化的認識。所以把最近回答的一些內容整理一下,權當記錄,留給3年後的自己 按慣例,容許我裝x開頭 一 架構的定義 在軟體開發...

mysql架構設計 初識mysql架構設計

一 應用系統如何與mysql進行一次互動?最開始接觸jdbc的時候,我們系統如何完成一次sql操作呢?第一步,建立資料庫連線 第二步,操作sql 第三步,釋放連線。但是每次建立與資料庫的連線非常耗時和資源,所以我們加入了連線池的概念。第一步的獲取連線是從連線池中獲取乙個可用的連線,第三步的釋放連線不...

軟體架構設計 二 系統總體架構設計

系統總體架構非常重要,但在表達上都不盡相同,下面介紹幾種常用的系統架構模式,供參考 assf access service biz standard fundation 模式 訪問 服務 業務功能 標準 基礎,對系統架構各個層次均有表達,但部署應用模式需要有單獨說明,如下圖方式組織系統總體架構 lo...