HDFS的特性與不足

2021-09-29 08:27:13 字數 721 閱讀 5957

海量的資料儲存: hdfs可橫向擴充套件,儲存的檔案可以支援pb級或者更高階別的資料儲存

高容錯性: 資料儲存多個副本,副本丟失後自動恢復. 可構建在廉價(與小型機,大型機相比較)的機器上,實現線性擴充套件(集群配置隨著伺服器的增加而增加),當集群增加新的節點之後,namenode也可以感知,進行負載均衡,講資料分發和備份資料均衡到新的節點上

商用硬體: hadoop並不需要執行在昂貴高可靠的硬體上,它是設計執行在商用硬體(廉價商業硬體)的集群上

大檔案儲存:hdfs採用資料塊的方式儲存資料,將資料物理切分成多個小的資料塊,所以再大的檔案,切分後,大資料變成了很多的小資料,使用者讀取時,重新將給多個小資料拼接起來

不能做到低延遲資料訪問:由於hadoop針對高資料吞吐量做了優化,犧牲了獲取資料的延遲,所以對於低延遲訪問資料的業務需求不適合hdfs

不適合大量的小檔案儲存:由於namenode將檔案系統的元資料資訊儲存在記憶體中,因此該檔案系統所能儲存的檔案總數受限於namenode的記憶體容量,根據經驗,每個檔案,目錄和資料塊的儲存資訊大約佔150個位元組.因此,如果有一百萬個小檔案,每個小檔案都會佔乙個資料塊,那至少需要300mb記憶體,如果是上億級別的,就會超出當前硬體的能力

修改檔案:hdfs適合一次寫入,多次讀取的場景,對於上傳的hdfs上的檔案,不支援修改檔案,hadoop2.0雖然支援了檔案追加功能,但不建議對hdfs上的檔案進行修改,因為效率是在是太低了!

不支援使用者的並行寫:同一時間內,只能有乙個使用者執行寫操作

HDFS特性與缺點的概述

目標 掌握hdfs具備的特性 1 海量資料儲存 hdfs可橫向擴充套件,其儲存的檔案可以支援pb級別或更高階別的資料儲存。2 高容錯性 資料儲存多個副本,副本丟失後自動恢復。可構建在廉價的機器上,實現線性擴充套件。當集群增加新節點之後,namenode也可以感知,進行負載均衡,將資料分發和備份資料均...

HDFS的特性和缺點

1 海量資料儲存 hdfs可橫向擴充套件,其儲存的檔案可以支援pb級別或更高階別的資料儲存。2 高容錯性 資料儲存多個副本,副本丟失後自動恢復。可構建在廉價的機器上,實現線性擴充套件。當集群增加新節點之後,namenode也可以感知,進行負載均衡,將資料分發和備份資料均衡到新的節點上。3 商用硬體 ...

HDFS的特性和缺點

海量資料儲存 hdfs 可橫向擴充套件,其儲存檔案可以支援pb級別資料 高容錯性 節點丟失,系統依然可用,資料儲存多個副本,副本丟失後自動恢復。可建構在廉價 與小型機大型機比 的機器上,實現線性擴充套件 隨著節點數量的增加,集群的儲存能力增加 大檔案儲存 dfs採用資料塊的方式儲存資料,將乙個大檔案...