Hadoop學習路線

2021-07-03 06:35:01 字數 963 閱讀 6739

按照這個路線圖來學習即可。

1、m. tim jones的三篇文章:

用hadoop進行分布式資料處理第1部分(入門):

用hadoop進行分布式資料處理第2部分(高階):

用hadoop進行分布式資料處理第3部分(應用程式開發):

2、「銀河裡的星星」的部落格,其中的google**系列(就包括開創性**「mapreduce:簡化大集群上的資料處理」)、搜尋與分布式方面的介紹

[google**三]mapreduce簡化大集群上的資料處理:

詞頻統計的map/reduce程式可以從這裡找到:

google**系列:

按照hadoop各元件來串聯:

3、ibm developerworks上的其他hadoop文章,在dw上用hadoop關鍵字進行搜尋,可以找到大量hadoop的文章

下面一些需要看:

hadoop distributed file system簡介:

使用apache pig處理資料:

4、《開源軟體架構》中的介紹

(卷1第8章)hdfs--hadoop分布式檔案系統:

英文原文:

(其中的卷1第8章)

5、阿里集團資料平台的官方部落格,包含大量hadoop研究和應用經驗

7、董的部落格,關於hadoop、分布式系統的研究

8、官方文件當然更不能少了,主要包括hadoop集群的搭建,mapreduce的使用,hdfs架構方面的介紹

優先看穩定版:

最新版(包括下一代mapreduce即yarn的介紹):

9、caibinbupt的部落格,hadoop源**分析系列

千與的專欄,hadoop-0.20.0原始碼分析

10、spork的部落格,其中關於hadoop的系列

11、chinacloud的部落格,其中的hadoop架構、分布式系統設計方面的一些經驗

12、beanmoon的部落格,其中的hadoop系列

hadoop自學路線

選擇乙個hadoop的版本,然後閱讀文件了解hadoop what s hadoop,why hadoop exists 安裝hadoop,三種方式都試下 在hadoop文件裡面有hadoop command的資料,i.hdfs command,ii.job command,盡量試試這兩方面的命令 ...

C 學習路線

這是我當初給自己定下c 的路線圖,我也是很浮躁的,定下了如此之好的路線,但是沒有堅持下去,可惜啊。但是好的路線圖是拿出來給大家,讓大家分享吧。c primer accelerated c essential c effective c c 程式設計規範 more effective c except...

C 學習路線

從學習c 到現在已經有四個年頭了,但是從來沒有很深入學習,有人說c 是物件導向的程式語言,但是我在這裡想說的是,c 是乙個多泛型的程式語言,它既可以面向過程,比如我們完全可以用c 寫c的 這是沒問題的,它也是乙個物件導向的語言,它具有物件導向的特徵,可以模擬現實世界中的各種事物 它也是乙個泛型程式語...