HDFS技術之副本機制（五）

hdfs上的檔案對應的block儲存了多個副本，且提供容錯機制，副本丟失或者宕機都會自動恢復，預設儲存3份副本，下面給出乙個副本擺放的架構圖。

第一副本：放置在上傳檔案的datanode上；如果是集群外提交，則隨機挑選一台磁碟不太慢、cpu不太忙的節點。

第二副本：放置在與第一副本不同的機架的節點上。

第三副本：與第二副本相同機架的不同節點上。

注意：如果還有更過的副本，則隨機放在節點上。

對於上傳檔案到hdfs時，此時hadoop的副本係數是幾，則檔案的塊副本數就有幾份，無論以後怎麼更改系統的副本係數，這個檔案的副本數都不會改變。

在上傳檔案時可以指定副本係數，dfs.replication是客戶端屬性，不指定具體的replication時採用預設副本數，如果仔細閱讀過hadoop+spark+zookeeper高可用集群搭建（二）的配置檔案的話，你會發現我們在hdfs-site.xml檔案中第一條配置的即為dfs.replication資訊。在檔案上傳後，備份數已經確定，此時再修改dfs.replication不會影響以前的檔案，也不會影響後面指定備份數的檔案，只會影響後面採用預設備份數的檔案。

replication預設是由客戶端決定的，如果客戶端未設定才會去配置檔案中讀取。

如果再hdfs-site.xml中設定了dfs.replication = 1，這也並不一定就是塊的備份數是1，因為可能沒把hdfs-site.xml加入到工程的classpath裡，那麼我們的程式執行時讀取的dfs.replication可能是hdfs-default.xml中的預設值3。

HDFS技術之副本機制（五）

HDFS的副本機制副本機制的過程

kafka 副本機制

分布式技術專題副本機制

HDFS技術之副本機制（五）

HDFS的副本機制 副本機制的過程

kafka 副本機制

分布式技術專題 副本機制

相關推薦

HDFS的副本機制副本機制的過程

分布式技術專題副本機制