大資料運維 HDFS學習

2022-06-14 03:15:09 字數 1502 閱讀 3832

一、hdfs概念

1、介紹

hadoop distributed file system,簡稱hdfs,是乙個分布式檔案系統。hdfs有著高容錯性(fault-tolerent)的特點,並且設計用來部署在低廉的(low-cost)硬體上。而且它提供高吞吐量(high throughput)來訪問應用程式的資料,適合那些有著超大資料集(large data set)的應用程式。hdfs放寬了(relax)posix的要求(requirements)這樣可以實現流的形式訪問(streaming access)檔案系統中的資料。hdfs開始是為開源的apache專案nutch的基礎結構而建立,hdfs是hadoop專案的一部分,而hadoop又是lucene的一部分。

2、發展歷史

3、設計目標

4、hdfs不適合的應用型別

5、hdfs構成

構成詳解:

6、namenode作用

7、datanode作用

8、hdfs檔案副本機制

9、機架感知

hdfs分布式檔案系統的內部有乙個副本存放策略:以預設的副本數=3為例:

1)第乙個副本塊存放本機

2)第二個副本塊和第乙個副本塊存放乙個機架不同主機(方便於第乙個主機掛掉,立即接管)

3)第三個副本塊存放不同機架的不同主機(防止乙個機架所有主機出現問題)

二、基本命令

web頁面訪問檔案目錄

命令詳解:

-cp

大資料基礎運維 HDFS引數調優

1.namenode資料目錄 dfs.name.dir,dfs.namenode.name.dir 指定乙個本地檔案系統路徑,決定nn在何處存放fsimage和editlog檔案。可以通過逗號分隔指定多個路徑.目前我們的產線環境只配置了乙個目錄,並存放在了做了raid1或raid5的磁碟上。2.da...

大資料運維 結語 大資料運維,大有作為

高俊峰 南非螞蟻 你好,看到這裡,恭喜你學完了本專欄的全部內容。本專欄的定位是零基礎入門大資料運維,所以你學習的內容更多是關於大資料平台各個元件的安裝 部署和配置,這些技術看似簡單,但操作起來,其實一點也不簡單。大資料平台中涉及的技術,都需要 理解原理 執行機制 才能順利完成配置,也只有完成了安裝部...

大資料 學習hdfs

hdfs是什麼?hadoop distributed file system,它是一種分布式檔案儲存系統,主要解決大資料的儲存問題。hdfs的優缺點 優點 缺點 hdfs的主要角色 namenode 簡稱nn 是hdfs的核心節點,最重要 主要功能是 接收客戶端的讀寫請求,接收datanode傳送的...