Hadoop分布式系統架構詳解

主要思想是「分組合併」思想。

分組：比如有乙個大型資料，那麼他就會將這個資料按照演算法分成多份，每份儲存在從屬主機上，並且在從屬主機上進行計算，主節點主要負責hadoop兩個關鍵功能模組hdfs、map reduce的監督。

合併：將每個機器上的計算結果合併起來再在一台機器上計算，得到最終結果。這

就是mapreduce 演算法。

hadoop主要的任務部署分為3個部分，分別是：client機器，主節點和從節點。主節點主要負責hadoop兩個關鍵功能模組hdfs、map reduce的監督。當job tracker使用map reduce進行監控和排程資料的並行處理時，名稱節點則負責hdfs監視和排程。從節點負責了機器執行的絕大部分，擔當所有資料儲存和指令計算的苦差。每個從節點既扮演者資料節點的角色又衝當與他們主節點通訊的守護程序。守護程序隸屬於job tracker，資料節點在歸屬於名稱節點。

1、hadoop的整體框架

hadoop由hdfs、mapreduce、hbase、hive和zookeeper等成員組成，其中最基礎最重要元素為底層用於儲存集群中所有儲存節點檔案的檔案系統hdfs（hadoop distributed file system）來執行mapreduce程式的mapreduce引擎。

Hadoop分布式系統架構詳解

hadoop分布式系統（上）

python分布式架構分布式架構

hadoop入門偽分布式詳解

Hadoop分布式系統架構詳解

hadoop分布式系統（上）

python分布式架構 分布式架構

hadoop入門 偽分布式詳解

相關推薦

python分布式架構分布式架構

hadoop入門偽分布式詳解