HDFS的體系結構和操作

2021-08-31 11:32:52 字數 1586 閱讀 6361

hdfs fs 常用命令

1.對hdfs操作的命令格式是hadoop fs

1.1 -ls

表示對hdfs下一級目錄的檢視

hadoop fs -ls hdfs://chaoren:9000/ ----對hdfs的根目錄進行檢視(linux下:ls /)

path:這個可以使用more core-site.xml進行檢視,發現裡面配置有這個path的值為hdfs://chaoren:9000。

1.2 -lsr

表示對hdfs目錄的遞迴檢視

hadoop fs -lsr hdfs://chaoren:9000/

hadoop fs -lsr /

這兩個命令的作用是一樣的,都是查詢hdfs根目錄下的

1.3 -mkdir

建立目錄

hadoop fs -mkdir /d1 —建立資料夾d1

hadoop fs -ls / —驗證資料夾是否建立成功

1.4 -put 從linux上傳檔案到hdfs
hadoop fs -put ./core-site.xml hdfs://chaoren:9000/d1

hadoop fs -get /d1/core-site.xml .

1.6 -text

檢視檔案內容

hadoop fs -text /d1/core-site.xml

1.7 -rm

表示刪除檔案

hadoop fs -rm /d1/core-site.xml

1.8 -rmr

表示遞迴刪除檔案

hadoop fs -rmr /d1

2.hdfs在對資料儲存進行block劃分時,如果檔案大小超過block,那麼按照block大小進行劃分;不如block size的,劃分為乙個塊,是實際資料大小。

namenode:

1、是整個檔案系統的管理節點。它維護著整個檔案系統的檔案目錄樹,檔案/目錄的元資訊和每個檔案對應的資料塊列表。接收使用者的操作請求。

2、檔案包括:(原始碼中hdfs-site.xml的dfs.name.dir屬性)

(1)fsimage:元資料映象檔案。儲存某一時段namenode記憶體元資料資訊。

(2)edits:操作日誌檔案。

(3)fstime:儲存最近一次checkpoint的時間。

以上這些檔案都是儲存在linux的檔案系統中。

datanode:

提供真實檔案資料的儲存服務。

檔案塊(block):最基本的儲存單位。hdfs預設block大小是64mb。
不同於普通檔案系統的是,hdfs中,如果乙個檔案小於乙個資料塊的大小,並不占用整個資料塊儲存空間,只占用實際大小!

replication:原始碼中hdfs-site.xml的dfs.replication屬性。多副本,預設是三個。

permissiondenyexception 許可權不足*****

錯誤:dfs.permissions的預設值是true。但是自己在用時,將其改為了false。改為了false,就不會報許可權不足的錯誤了。

HDFS體系結構

1 什麼是分布式檔案系統?於是有了分布式檔案系統,分布式檔案系統允許檔案通過網路在多台主機上分享檔案,可以讓多機器上的使用者分享檔案和儲存空間,讓使用者感覺像是在訪問一台機器。hdfs是分布式檔案系統的一種,不適合小檔案,適用於一次寫多次讀的情況,不支援併發寫。那麼元資訊存在哪呢?在hadoop t...

HDFS體系結構 各種程序狀態

namenode預設大小1000m namenode守護程序作用 維護hdfs集群元資料的映象檔案 fsimage fsimage 包括 檔案屬性資訊,檔案與block塊的對應關係 維護客戶端對hdfs的相關操作,並記錄 edits log 接收所有來自datanode的心跳匯報,內容 block塊...

硬體和體系結構

引導過程和 bios 引導的過程涉及到從外部儲存裝置 比如軟盤 cd 硬碟或者儲存鑰匙 memory key 中載入作業系統。執行這一初始載入的程式固化儲存在計算機中,稱為 基本輸入輸出系統 basic input output system,bios bios 儲存在非易失性的 non volat...