hadoop常見問題

2022-05-03 20:21:09 字數 852 閱讀 7996

1。執行mapreduce程式出錯,

connection to resourcemanager

retrying ...

retrying ...

原因是沒有啟動yarn或者啟動失敗

2.hdfs namenode -format 只是初始化了namenode的工作目錄

而datanode的工作目錄是在datanode啟動後自己初始化的

3。datanode 不被namemode識別的問題

namenode在format初始化的時候會形成兩個標識

blockpoolid

clusterid

新的datanode加入時,會獲取這兩個標識作為自己工作目錄中的標識

一旦namenamenode重新format後,namenode的身份標識已經改變,而datanode如果依然持有原來的id,就不會被namenode識別

解決辦法是刪除(清空)datanode的工作目錄

4。datanode下線後多久看到效果,(頁面上不會立即顯示出已經下線)

有乙個超時時間,超過了這個時間才被認定下線

5.關於副本數量的問題

副本數由客戶端的引數dfs.replication決定(優先順序:**中的conf.set> 自定義配置檔案》jar包中的hdfs-default.xml)

上傳資料時 datanode的選擇策略

1第乙個副本先考慮跟client最近的datanode

第二個副本再考慮跨機架挑選乙個datanode,增加副本的可靠性

3.選擇同機架的乙個datanode

檔案傳輸是以packet為單位的64kb ,在packet中有chunk概念,chunk是512位元組會校驗一次

hadoop常見問題彙總

本文彙總了幾個hadoop yarn中常見問題以及解決方案,注意,本文介紹解決方案適用於hadoop 2.2.0以及以上版本。1 預設情況下,各個節點的負載不均衡 任務數目不同 有的節點很多任務在跑,有的沒有任務,怎樣讓各個節點任務數目盡可能均衡呢?答 預設情況下,資源排程器處於批排程模式下,即乙個...

hadoop常見問題總結1

問題1 http localhost 50030 解決辦法 buid本地庫存後,應該把build目錄刪除,否則啟動指令碼會把目錄重定向到build目錄中,導致web管理頁面打不開,啟動指令碼中,如果有build目錄,就將路徑轉到build下.問題2 http localhost 50070 unab...

hadoop 配置中常見問題記錄

問題1 jobtracker.info could only be replicated to 0 nodes,instead of 1 錯誤解決 通過搜尋,大部分說是防火牆問題,於是我就關閉了防火牆,把系統的防火牆都關掉了,刪除格式化時生成的檔案,及執行是的tmp檔案,然後重新格式化,再次執行st...