Impala概念及架構知識點詳解

2021-12-30 08:53:53 字數 590 閱讀 5141

impala伺服器是乙個分布式、大規模並行處理(mpp)資料庫引擎。

執行在集群每個節點上的守護程序,名稱為impalad。

負責讀寫資料檔案;接受查詢請求,將查詢結果返回給中心協調者節點。

statestore搜尋集群中impalad程序節點的健康狀態,並不斷將健康狀態的結果**給所有的impalad程序節點。statestore程序的名稱為statestored。乙個impala集群只需要乙個statestored程序節點。

sql語句引起元資料變化時,catalog服務將變化推送到其他節點。名稱為catalogd,也是只需要乙個程序。

繼承apache hiveql的sql語法。

可以通過如下方式向impala提交請求:

* impala-shell 互動式命令列

* apache hue基於web的使用者介面

* jdbc

* odbc

impala和hive都是使用使用傳統的mysql或postgresql作為元資料庫儲存表定義資訊。

impala使用分布式檔案系統hdfs作為主要的資料儲存方式。

hbase是替代hdfs作為impala的資料儲存的另一種方式。

Impala之概念及架構

impala伺服器是乙個分布式,大規模並行處理 mpp 資料庫引擎。它包括執行在cdh集群主機上的不同後台程序。1,客戶端 有三類客戶端可以與impala進行互動 基於驅動程式的客戶端 odbc driver和jdbc driver,其中jdbc driver支援hive1與hive2風格的驅動形式...

Impala概念及架構解析

impala伺服器是乙個分布式 大規模並行處理 mpp 資料庫引擎。執行在集群每個節點上的守護程序,名稱為impalad。負責讀寫資料檔案 接受查詢請求,將查詢結果返回給中心協調者節點。statestore搜尋集群中impalad程序節點的健康狀態,並不斷將健康狀態的結果 給所有的impalad程序...

Spark 重要概念及相關知識點

看到這裡,恭喜你,結束了分布式儲存模組的內容,願此刻你已經把前面的章節都看透了,但是即便如此也還是不要鬆懈,接下來還有乙個大模組的內容。因為大資料的技術基本都是計算與儲存分離,各司其職,所以我們需要繼續來看分布式計算模組的內容,讓我們大資料面試的知識點更加完善。第一篇寫的是分布式計算界的中流砥柱,s...