Hadoop學習筆記 哪些場景適用,哪些不適用。

2021-09-01 17:01:05 字數 529 閱讀 7218

hadoop不是萬能的,有些場景適用,有些不適用。

hadoop設計的目的主要包括下面幾個方面,也就是所謂的適用場景:

1:超大檔案

可以是幾百m,幾百t這個級別的檔案。

2:流式資料訪問

hadoop適用於一次寫入,多次讀取的場景,也就是資料複製進去之後,長時間在這些資料上進行分析。

3:商業硬體

也就是說大街上到處都能買到的那種硬體,這樣的硬體故障率較高,所以要有很好的容錯機制。

接下來說說不適用的場景:

1: 低延遲資料訪問

hadoop設計的目的是大吞吐量,所以並沒有針對低延遲資料訪問做一些優化,如果要求低延遲, 可以看看hbase。

2: 大量的小檔案

由於namenode把檔案的metadata儲存在記憶體中,所以大量的小檔案會產生大量的metadata。這樣的話百萬級別的檔案數目還是可行的,再多的話就有問題了。

3: 多使用者寫入,任意修改

hadoop現在還不支援多人寫入,任意修改的功能。也就是說每次寫入都會新增在檔案末尾。

Hadoop學習筆記 Hadoop初識

序言 資訊化發展到當今,網際網路的資料量是不斷地增加,那麼如何很好的處理以及利用這些資料可能是未來的乙個發展方向,這也之所以產生了各種平台的雲計算。對於網際網路而言,大資料量可分為兩種 第 一 大訪問量請求 第 二 大資料量處理。大訪問量請求這個事應用端應該思考的問題,如何很好的處理大的訪問量,如何...

Hadoop學習筆記

hadoop介紹 hadoop是google雲計算框架的開源實現,是乙個分布式儲存和分布式計算的框架,主要包括hdfs和mapreduce的實現。hdfs hdfs由乙個namenode和多個datanode組成,其中namenode相當於系統的元資料存放地,它是hadoop系統的神經中樞,而多個d...

Hadoop學習筆記

fsimage 記憶體元資料 editlog 效率 安全監測節點錯誤 datanode向namanode定時返回心跳 監測網路錯誤 資料傳送後返回ack 監測儲存錯誤 傳輸資料損壞,通過資料的checksum監測 硬碟儲存資料損壞,通過每個block的checksum監測 partition 將ma...