HDFS學習筆記之《技巧》

2021-07-09 03:41:28 字數 1090 閱讀 5507

hdfs基本命令:

hadoop fs -cmd

cmd: 具體的操作,基本上與unix的命令列相同

args:引數

hdfs資源uri格式

scheme://authority/path

scheme:協議名,file或hdfs

authority:namenode主機名

path:路徑

示例:hdfs://localhost:9000/user/chunk/test.txt

假設已經在core-site.xml裡配置了 fs.default.name=hdfs://localhost:9000,則僅使用/user/chunk/test.txt即可。

hdfs預設工作目錄為 /user/$user,$user是當前的登入使用者名稱。

hdfs命令示例:

hadoop fs -mkdir /user/trunk

hadoop fs -ls /user

hadoop fs -lsr /user   (遞迴的)

hadoop fs -put test.txt /user/trunk

hadoop fs -put test.txt .  (複製到hdfs

當前目錄下,首先要建立當前目錄)

hadoop fs -get /user/trunk/test.txt . (複製到本地當前目錄下)

hadoop fs -cat /user/trunk/test.txt

hadoop fs -tail /user/trunk/test.txt  (檢視最後1000位元組)

hadoop fs -rm /user/trunk/test.txt

hadoop fs -help ls (檢視ls命令的幫助文件)

檢視某個檔案是否存在可以這麼做:

hadoop fs -cat hdfs://namenode主機名/user/root/test/word.txt

不用加9000埠號

hadoop沒有當前目錄的概念,當然也不能進入in目錄,更沒有cd命令。所以檢視時必須輸入目錄路徑。

HDFS學習筆記

3 hdfs儲存原理 主節點 資料目錄 元資料 服務 從節點 具體完成資料的儲存任務 hdfs 相容廉價的硬體裝置,實現流資料讀寫,支援大資料集,支援簡單的檔案模型,強大的跨平台相容性 hdfs侷限性 不適合低延遲資料訪問,無法高效儲存大量小檔案,不支援多使用者寫入以及任意修改檔案。1 為了分攤磁碟...

HDFS學習筆記

hdfs學習筆記 hdfs,是hadoop distributed file system的簡稱,是hadoop抽象檔案系統的一種實現。hdfs的檔案分布在集群機器上,同時提供副本進行容錯及可靠性保證。例如客戶端寫入讀取檔案的直接操作都是分布在集群各個機器上的,沒有單點效能壓力。什麼是hdfs 1....

HDFS學習筆記

1 流式資料訪問 一次寫入,多次讀取是最高效的訪問模式。資料集通常由資料來源生成或從資料來源複製而來,每次分析都在該資料集上進行 2 資料塊 檔案的獨立儲存單元,預設64mb 目的是為了最小化定址開銷 塊的元資料存在namenode的記憶體中 hdfs中乙個小於塊大小的檔案不會佔據整個塊的空間 3 ...