hadoop 知識點回顧

2021-07-22 07:48:16 字數 873 閱讀 8416

hadoop 2.x 生態系統組成

hadoop 組成

namenode 

元資料伺服器,屬於管理層,用於管理資料的儲存,主節點,儲存檔案的元資料,如檔名,檔案目錄結構,檔案屬性,生成時間,副本數,檔案許可權)及每個檔案的塊列表及塊所在datanode等。

secondary namenode 輔助元資料伺服器

jobtracker 

任務排程員,管理層程式,管理集群資源並對任務進行資源排程,監控任務執行,負責使用者提交的作業,負責啟動,跟蹤任務的執行。

datanodes 

塊儲存   屬於應用層,使用者資料儲存在datanodes ,被namenode 管理,定時向namenode匯報工作情況,執行namenode 分配分發的任務,儲存檔案塊資料及塊資料的校驗和。

tasktrackers 

任務執行,應用層程式,執行jobtracker分發的任務,並想jobtracker 匯報工作情況,管理各個任務在每個節點的執**況。

mapreduce 分布式離線計算框架

yarn  集群資源管理系統

hdfs 分布式檔案系統

hadoop  部署模式

單機模式 standalone

偽分布式模式 pseudo-distriubuted

一台機器上執行所有的hadoop 服務(五個守護程序)

全分布式模式 fully distributed

知識點回顧

回顧 簡介 python 安裝 python3.8.5 why?python解釋型語言,安裝python3 直譯器 lib pip命令 pip list pip install x pip uninstall 解除安裝 pip install 版本號 pip freeze requiremente....

知識點回顧

方法 變數作用域 方法過載 ref 引用傳參,側重於在方法中一定要修改引數,傳入方法前必須賦值 out 側重於輸出,方法返回前 引數使用前 必須賦值 params 可變引數,只能修飾陣列型別,只能在方法列表的最後.如果沒有給可變引數賦值,那麼可變引數會自動初始化長度為0.方法遞迴 迴圈 方法自己呼叫...

c 知識點回顧

過載只與函式的引數有關,而與函式的返回型別無關 int 形參 實參 0 char short int double 形參 實參 float double 用省略號 表示,即函式可以有任意個任意型別的引數。如,int printf const char format,在乙個函式中,可指定多個 甚至全部...