大資料學習 關於hdfs

2022-09-10 20:45:23 字數 817 閱讀 8027

高容錯性

適合處理大資料

可構建在廉價機器上

不適合低延時資料訪問

無法高效的對大量小檔案進行儲存

儲存大量小檔案的話,它會占用namenode大量的記憶體來儲存檔案目錄和塊資訊。

小檔案儲存的定址時間會超過讀取時間

不支援併發寫入、檔案隨機修改

乙個檔案只能有乙個寫,不允許多個執行緒同時寫

datanode:sl**e。namenode下達命令,datanode執行實際的操作

client:客戶端

secondary namenode:並非namenode的備份。他並不能替換namenode。

hdfs塊太小會增加定址時間

hdfs塊太大從磁碟傳輸資料的時間會明顯大於定位這個塊開始位置所需的時間

ps:hdfs塊的大小設定主要取決於磁碟的傳輸速度

-cp:從hdfs的乙個路徑拷貝到hdfs 的另乙個路徑

-mv:從hdfs的乙個路徑移動到hdfs 的另乙個路徑

-put:等同於-copyfromlocal

-tail:顯示乙個檔案末尾

-rm:刪除檔案或資料夾

-rmdir:刪除空目錄

-du -h [-s]:統計資料夾的大小資訊

根據自己電腦的作業系統拷貝對應的編譯後的hadoop jar包到非中文路徑

配置hadoop_home 環境變數

大資料 學習hdfs

hdfs是什麼?hadoop distributed file system,它是一種分布式檔案儲存系統,主要解決大資料的儲存問題。hdfs的優缺點 優點 缺點 hdfs的主要角色 namenode 簡稱nn 是hdfs的核心節點,最重要 主要功能是 接收客戶端的讀寫請求,接收datanode傳送的...

獲取hdfs (大資料)HDFS

hdfs 是 hadoop 的分布式檔案系統,主要用於離線的大檔案資料資料儲存。hdfs 架構 hdfs 其實與作業系統的檔案系統類似,hdfs 主要有兩種角色,乙個是 namenode 檔案索引 另乙個是 datanode 儲存資料 namenode 主要負責記錄乙個檔案的儲存元資料 例如 檔名 ...

大資料學習Hdfs詳解1

hdfs架構設計 主從 nn 主 名稱節點 扮演老大的角色 snn 第二名稱節點 nn 扮演二把手的角色 dn 從 資料節點 扮演小弟的角色 dfs.blocksize 134217728 128m 不滿128m也算乙個塊 例如 hdfs site.xml下的引數dfs.replication 為1...