HDFS的基本的架構

2021-09-11 13:35:06 字數 883 閱讀 8560

一、hdfs的基本的概述

(1)、hdfs是hadoop的分布式檔案系統,也是hadoop的重要元件之一,每乙個事物都存在缺點和優點hdfs也不例外,具體的優點缺點如下。

(2)、hdfs的優點如下:

(a)、高容錯性,乙份資料在hdfs集群上由多個副本,即使其中某乙份資料丟失了,會通過自己的恢復機制從其他的資料副本恢復資料。

(b)、廉價,只需要普通的電腦就能搭建hdfs檔案系統,並且儲存容量可以動態的增加和減少。

(c)、資料的儲存規模大,適合對大量的資料進行儲存和分析。

(d)、適合一次寫入,多次讀取但是不支援資料的修改但是支援資料的追加。

(3)、hdfs的缺點如下:

(a)、響應比較慢,無法滿足毫秒級的響應需求。

(b)、不適合用於儲存大量的小檔案,因為大量的小檔案會大量占用nm的儲存空間,同時小檔案的定址時間大於資料的讀取時間這樣效率比較低。

(c)、不支援併發的的讀寫資料,這樣傳輸資料比較慢。

二、基本的架構

(1)、client其主要的職責如下

(2)、namenode主要的職責如下

(a)、負責資料塊對映資訊的管理,在上傳資料的時候給client返回可以上傳的資料節點,在需要獲取資料的時候返回資料所在的節點,其本身並不儲存資料。

(b)、副本資料的管理策略。

(c)、管理hdfs的命名空間

(3)、datanode的主要的職責如下

(a)、負責資料的儲存以及資料的讀寫。

(4)、secondarynamenode主要職責

(a)、是nm的乙個備用。

(b)、減去nm的負擔,對nm中的日誌以及映象檔案進行合併在把合併之後的資料發回到nm。

三、hdfs架構的示意圖

HDFS基本架構總結

hdfs為主 從架構,主要由管理檔案系統的namenode和儲存資料的datanode組成。namenode介紹及作用 datanode介紹及作用 secondarynamenode 副本存放策略 一般來說,資料是以block儲存在datanode節點上。假如說,在datanode節點上提交檔案,那...

HDFS的基本操作

mkdir 在hdfs建立目錄 hdfs dfs mkdir data ls 檢視當前目錄 hdfs dfs ls ls r 檢視目錄與子目錄 put 上傳乙個檔案 hdfs dfs put data.txt data input movefromlocal 上傳乙個檔案,會刪除本地檔案 ctrl ...

HDFS架構簡述

hdfs架構簡述 一 hdfs簡介 hdfs hadoop distributed file system hadoop分布式檔案系統。是基於流資料模式訪問和處理超大檔案的需要而開發的,可以執行於廉價的伺服器上。它所具有的高容錯,高可靠性,高可擴充套件性,高獲得性,高吞吐率等特徵為海量資料提供了不怕...