Hadoop學習筆記

2021-09-01 08:54:38 字數 345 閱讀 2983

一.  mapreduce

mapreduce是一種用於資料處理的程式設計模型。

mapreduce本質是並行的,因此可在在乙個擁有足夠多機器的環境下完成大規模資料分析任務.即mapreduce的優勢在於處理大型資料集。

**:見附件1

單一reduce資料流圖

二. hadoop分布式檔案系統

三. hadoop的i/o

四. hadoop的應用

五. mapreduce工作原理

六. mapreduce的型別與格式

七. mapreduce特性

八. hadoop集群安裝

九. hadoop管理

Hadoop學習筆記 Hadoop初識

序言 資訊化發展到當今,網際網路的資料量是不斷地增加,那麼如何很好的處理以及利用這些資料可能是未來的乙個發展方向,這也之所以產生了各種平台的雲計算。對於網際網路而言,大資料量可分為兩種 第 一 大訪問量請求 第 二 大資料量處理。大訪問量請求這個事應用端應該思考的問題,如何很好的處理大的訪問量,如何...

Hadoop學習筆記

hadoop介紹 hadoop是google雲計算框架的開源實現,是乙個分布式儲存和分布式計算的框架,主要包括hdfs和mapreduce的實現。hdfs hdfs由乙個namenode和多個datanode組成,其中namenode相當於系統的元資料存放地,它是hadoop系統的神經中樞,而多個d...

Hadoop學習筆記

fsimage 記憶體元資料 editlog 效率 安全監測節點錯誤 datanode向namanode定時返回心跳 監測網路錯誤 資料傳送後返回ack 監測儲存錯誤 傳輸資料損壞,通過資料的checksum監測 硬碟儲存資料損壞,通過每個block的checksum監測 partition 將ma...