HDFS讀寫流程

2022-01-10 19:12:59 字數 566 閱讀 9897

1.在客戶端提交引數後,客戶端(client)通過呼叫filesystem物件的open()方法來開啟需要讀取的檔案

2.distributedfilesystem呼叫元資料節點,得到block資訊,對於每乙個資料塊元資料返回儲存資料塊的資料節點位址

3.distributedfilesystem返回fsdatainputstream給客戶端,用來讀取資料

4.客戶端呼叫stream的read()函式開始讀取資料(也會讀取block元資料)

5.data從資料節點讀到client,此塊讀取完畢時,dfsinpustream關閉和此節點鏈結,再連線此檔案下乙個block最近節點

6.client讀取完畢時,呼叫fsdatainputstream的close()函式

7.若讀取出錯,則嘗試連線下乙個包含此block的節點,故障節點不在連線!

hdfs讀寫流程 HDFS 讀寫流程(詳解)

hdfs hadoop distributed file system 是gfs的開源實現。1 優點 因為有多個副本,可以保證資料可靠,容錯性高 計算向資料移動,適用於批處理 適合大資料處理,gb tb pb級資料,百萬以上的檔案,十萬以上的節點 可以構建在廉價機器上,通過多副本提高可靠性 2 缺點...

hdfs讀寫流程 HDFS 檔案讀寫流程

開啟分布式檔案 呼叫分布式檔案 distributedfilesystem.open 方法 定址請求 從 namenode 處得到 datanode 的位址,distributedfilesystem使用 rpc 方式呼叫了namenode,namenode 返回存有該副本的datanode 位址,...

hdfs讀寫流程

1.client發起檔案上傳請求 通過rpc和namenode建立連線,namenode檢查目標檔案是否存在,檢查父目錄是否存在,檢查使用者是否有許可權,返回是否可以上傳 2.client請求第乙個block該傳輸到那些datanode伺服器上 3.namenode根據配置檔案中指定的備份數量及機架...