大資料學習筆記

**：

大資料處理是雲計算中非常重要的領域，自google公司提出mapreduce分布式處理框架以來，以hadoop為代表的開源軟體受到越來越多公司的重視和青睞。本文將講述hadoop系統中的乙個新成員：impala。

impala架構分析

impala是cloudera公司主導開發的新型查詢系統，它提供sql 語義，能查詢儲存在hadoop的hdfs和hbase中的pb級大資料。已有的hive系統雖然也提供了sql語義，但由於hive底層執行使用的是 mapreduce引擎，仍然是乙個批處理過程，難以滿足查詢的互動性。相比之下，impala的最大特點也是最大賣點就是它的快速。那麼impala如何實現大資料的快速查詢呢？在回答這個問題前，需要先介紹google的dremel系統，因為impala最開始是參照 dremel系統進行設計的。

大資料學習筆記

大資料學習筆記 1 1 了解大資料

大資料學習筆記1

大資料學習筆記（05）

大資料學習筆記

大資料學習筆記 1 1 了解大資料

大資料學習筆記1

大資料學習筆記（05）

相關推薦