掉線時限引數設定

2021-09-29 08:39:40 字數 1815 閱讀 5937

掉線時限引數設定

datanode程序 died 或者網路故障造成datanode無法與namenode通訊,namenode不會立即把該節點判定為died(宕機),要經過一段時間,這段時間暫稱作超時時長。hdfs預設的超時時長為10分鐘+30秒。如果定義超時時間為timeout,則超時時長的計算公式為:

timeout = 2 * dfs.namenode.heartbeat.recheck-interval + 10 * dfs.heartbeat.interval。

而預設的dfs.namenode.heartbeat.recheck-interval 大小為5分鐘,dfs.heartbeat.interval預設為3秒。

需要注意的是hdfs-site.xml 配置檔案中的heartbeat.recheck.interval的單位為毫秒,dfs.heartbeat.interval的單位為秒。

dfs.namenode.heartbeat.recheck-interval

300000

dfs.heartbeat.interval

3datanode的目錄結構

目標:掌握datanode的目錄結構

和namenode不同的是,datanode的儲存目錄是初始階段自動建立的,不需要額外格式化。在/export/servers/hadoop-2.6.0-cdh5.14.0/hadoopdatas/datanodedatas/current這個目錄下檢視版本號

[root@node01 current]# cat version

#thu mar 14 07:58:46 cst 2019

storageid=ds-47bcc6d5-c9b7-4c88-9cc8-6154b8a2bf39

clusterid=cid-dac2e9fa-65d2-4963-a7b5-bb4d0280d3f4

ctime=0

datanodeuuid=c44514a0-9ed6-4642-b3a8-5af79f03d7a4

storagetype=data_node

layoutversion=-56

具體解釋

(1)storageid:儲存id號

(2)clusterid集群id,全域性唯一

(3)ctime屬性標記了datanode儲存系統的建立時間,對於剛剛格式化的儲存系統,這個屬性為0;但是在檔案系統公升級之後,該值會更新到新的時間戳。

(4)datanodeuuid:datanode的唯一識別碼

(5)storagetype:儲存型別

(6)layoutversion是乙個負整數。通常只有hdfs增加新特性時才會更新這個版本號。

目錄結構

這個例子中「test.txt」有兩個資料塊。

第乙個塊「block0」, 塊大小134217728(128m),塊id:1073741853,塊池id:bp-866966434-192.168.100.129-1560531186882,儲存在節點node01,node03上。
第二個塊「block0」, 塊大小49671168(47.3m) ,塊id: 1073741854,塊池id:bp-866966434-192.168.100.129-1560531186882,儲存在節點node01,node03上。

進入node01或node03節點的datanode儲存資料的目錄,進入到塊池的id目錄

/export/servers/hadoop-2.6.0-cdh5.14.0/hadoopdatas/datanodedatas/current/bp-866966434-192.168.100.129-1560531186882

進入到blk的目錄找到塊的id

Hadoop HDFS 掉線時限引數設定

datanode程序死亡或者網路故障造成datanode無法與namenode通訊時,namenode不會立即把該節點判定為死亡,要經過一段時間,這段時間暫稱作超時時長。hdfs預設的超時時長為10分鐘 30秒。如果定義超時時間為timeout,則超時時長的計算公式為 timeout 2 dfs.n...

大資料 hdfs 掉線時限的引數設定 詳解

datanode程序死亡或者網路故障造成datanode無法與namenode通訊,namenode不會立即把該節點判定為死亡,要經過一段時間,這段時間暫稱作超時時長。hdfs預設的超時時長為10分鐘 30秒。如果定義超時時間為timeout,則超時時長的計算公式為 timeout 2 dfs.na...

引數設定 pandas引數設定小技巧

python大資料分析記錄 分享 成長 在日常使用pandas的過程中,由於我們所分析的資料表規模 格式上的差異,使得同樣的函式或方法作用在不同資料上的效果存在差異。而pandas有著自己的一套 引數設定系統 可以幫助我們在遇到不同的資料時靈活調節從而達到最好的效果,本文就將介紹pandas中常用的...