搞hadoop的總結

從7月19號開始，搞了三個半月hadoop了，也沒怎麼用心，真正用心做的時間甚至都不超過一周的工作時間，慚愧，愧對信任我的老師，本來打算九月底出**，到現在hadoop的例子都沒執行出來。

權威指南看的馬馬虎虎，所有的內容都沒有認認真真地理解，沒有逐字逐句地研究，又想起了在本科畢業後在天健做研發，懶惰的想法，隨時隨地的天馬行空，對自己寫程式，做研發，真的沒信心了，但是，一屋不掃何以掃天下？寫程式基本就是個體力活，與智商無關，與情商無關，只與認真與否有關。

現在在做的是一篇**的還原，從本質上說就是實現下hadoop的udf的功能定製，涉及到的模組有 inputformat， filesplit， recordreader，map和reduce，現在是完全沒有思路，改寫也完全沒有進入狀態，想週末之前拿出來個結果，看來是行不通了

之前困惑的是沒有資料，貌似俞老師也說過這樣的話，但是完全是站在不同的高度上說的，我是完全不上心，最基本的都沒看明白，jar包中的文件看了十分之一都不到，contribute的那些定製的jar包完全都沒明白。那裡面就是自定義的udf，這就是範例，要研究的就是這些，當然例子中功能很多，看明白，選取我們想要的東西就好了。排程的那幾個演算法，fifo（預設），公平排程，capacity 排程，這幾個包甚至可以研究一下，（不過原理明白是最重要的吧？）

想找好工作，而且是有戶口的，也就是說網際網路的國企，那麼就要去做搜尋了，搜尋的後台，必然是用linux， c++來做文章的，後台程式的重頭戲還是演算法，多執行緒程式設計，（基礎最紮實的人才行）任務太艱鉅了；話說不知道**是否有戲，下週去會會**，估計聯想和哥那個公司也該有信了。

新的發現，contribute中的用法還有：index中是與lucene結合，建立索引的測試，其中都涉及到了inputformat和recordreader的寫法，很好的參照，基本就是按照這些來寫了；其他的**也要好好研究，

benchmark的源**

搞hadoop的總結

搞機經驗總結

hadoop命令總結

hadoop學習總結

搞hadoop的總結

搞機經驗總結

hadoop命令總結

hadoop學習總結

相關推薦