Hadoop大資料處理

《hadoop大資料處理》以大資料處理系統的三大關鍵要素——「儲存」、「計算」與「容錯」為起點，深入淺出地介紹了如何使用hadoop這一高效能分布式技術完成大資料處理任務。本書不僅包含了使用hadoop進行大資料處理的實踐性知識和示例，還以**並茂的形式系統性地揭示了hadoop技術族中關鍵元件的執行原理和優化手段，為讀者進一步提公升hadoop使用技巧和執行效率提供了頗具價值的參考。

《hadoop大資料處理》共10章，涉及的主題包括大資料處理概論、基於hadoop的大資料處理框架、mapreduce計算模式、使用hdfs儲存大資料、hbase大資料庫、大資料的分析處理、hadoop環境下的資料整合、hadoop集群的管理與維護、基於mapreduce的資料探勘實踐及面向未來的大資料處理技術。最後附有乙個在windows環境下搭建hadoop開發及除錯環境的參考手冊。

《hadoop大資料處理》適合需要使用hadoop處理大資料的程式設計師、架構師和產品經理作為技術參考和培訓資料，也可作為高校研究生和本科生教材。