Hadoop 檔案部分命令 檔案行數

2021-08-23 12:06:19 字數 501 閱讀 8657

hadoop fs -get  /目錄   目錄
結果是輸出到本地的資料夾之中

2.多個檔案合併後輸出到乙個檔案之中

hadoop fs -getmerge  filepath  localpath/data.dat
3.統計多個檔案行數

hadoop fs -cat

/檔案*

| wc -l

hadoop fs -cat /datastream/portal/jinritoutiao/video/2018-08

-11/portal_jinritoutiao_video_20180811*|wc -l

檢視該目錄下所有檔名包含portal_jinritoutiao_video_20180811的行數

4.統計檔案大小

hadoop fs -count /檔案*

Hadoop 檔案操作常用的命令

hdfs fsck files blocks 列出檔案系統中各個檔案由哪些塊組成 hadoop fs ls 列出hdfs檔案的所有檔案,不遞迴目錄 hadoop fs lsr hadoop fs ls r 規範寫法 遞迴檢視指定目錄下的所有內容 hadoop fs cp dir01 1.txt di...

shell命令使用Hadoop歸檔檔案

每個檔案hdfs採用塊方式進行儲存,在系統執行時,檔案塊的元資料資訊會被儲存在namenode的記憶體中,因此,對hdfs來說,大規模儲存小檔案顯然是低效的,很多小檔案會耗盡namenode的大部分記憶體。hadoop歸檔檔案和har檔案可以將檔案高效地放入hdfs塊中的檔案存檔裝置,在減少name...

Hadoop 初識HDFS檔案操作命令

客戶端rpc埠是8020 web端訪問埠50070 docker run p 22022 22 p 8020 8020 p 50010 50010 p 50020 50020 p 50070 50070 p 50075 50075 it mdouchement hdfs進入容器即可使用fs命令操作檔...