hdfs讀取資料的整體流程

2021-10-25 06:59:50 字數 352 閱讀 5128

hdfs讀取資料的整體流程

1,客戶端節點(**)獲取filesystem

2,filesystem去namenode上獲取要讀取的檔案塊位置。並且返回給客戶端節點

3,獲取到檔案的所有塊資訊以後,fsdatainputstream開始準備在不同的塊中讀取資料。

4,fsdatainputstream內部有乙個類,hdfsdatainputstream 儲存檔案的塊資訊列表,還負責挑選最近和最新的塊在**。

fsdatainputstream內部另乙個類,streamer 負責讀取操作

5,資料直接從datanode從節點讀取到了客戶端,不經過主節點。

HDFS讀取資料的流程

1 客戶端通過呼叫filesystem物件的open 來讀取希望開啟的檔案。2 client向namenode發起rpc請求,來確定請求檔案block所在的位置 3 namenode會視情況返回檔案的部分或者全部block列表,對於每個block,namenode 都會返回含有該 block 副本的...

HDFS 讀取流程

先看圖 hdfs客戶端要讀取資料首先必須和namenode 建立連線,獲取datanode資訊。namenode會根據客戶端的實體地址返回乙個由近到遠的塊位址列表。客戶端拿到列表後和最近的進行連線讀取資料 hdfs中塊是由乙個完整的檔案分成多個塊,而每個塊可能儲存在不同機架上。每個塊中除了資料還儲存...

HDFS讀取流程和寫流程

讀 1.客戶端或者使用者通過呼叫 filesystem 物件的 open 方法開啟需要讀取的檔案,這對 hdfs 來說是常見乙個分布式檔案系統的乙個讀取例項。2.filesystem 通過遠端協議呼叫 namenode 確定檔案的前幾個 block 的位置。對於每乙個 block,namenode ...