Hive 概念 優缺點及使用場景

2021-10-04 08:13:22 字數 798 閱讀 6144

概念hive是構建與hadoop之上的資料倉儲軟體,能夠有效的讀取、寫入和管理大型資料集合, 並且支援通過sql查詢分析資料。(hive是基於hadoop的,hadoop資料處理任務本質上是 mapreduce,所以hivesql執行本質上都是mapreduce任務)。

優缺點比較

優點缺點

1、可以通過sql完成etl(抽取/轉換/載入)任務、生成報表、以及資料分析。

2、避免複雜的mapreduce的開發,能夠節省大量開發成本 hive本質上作為乙個工具,能夠支援多種資料分析引擎。

3、hive可以支援hadoop的mapreduce分析引擎,也可以支援spark等分析引擎。

4、hive提供jdbc服務,可以通過jdbc連線hive操作hdfs資料,並且可以整合多種bi視覺化工具,hive可以通過元資料直接訪問hdfs上的資料。

5、hive能夠支援多種資料型別和檔案格式 。

6、hive支援自定義函式,使用者可以根據需求定義自己的函式進行擴充套件

1、hive不支援事務操作

2、hivesql本身表達能力有限,不能夠進行迭代式計算以及資料探勘

3、hive操作預設基於mapreduce引擎,延遲比較高不適用於互動式查詢。並且基於sql調優困難

使用場景

hive可構建基於hadoop的資料倉儲

hive適合大資料集的批處理作業,比如行為日誌分析、多維資料分析

海量結構化資料離線分析

本節完!

Hive的優缺點及框架概念

1 hive處理的資料儲存在hdfs 2 hive分析資料底層的實現是mapreduce 3 執行程式執行在yarn上 1 操作介面採用類sql語法,提供快速開發的能力 簡單 容易上手 2 避免了去寫mapreduce,減少開發人員的學習成本。3 hive的執行延遲比較高,因此hive常用於資料分析...

Docker的使用場景以及優缺點

虛擬機器的最大好處是能在你的硬體設施上執行各種配置不一樣的平台 軟體,系統 docker在降低額外開銷的情況下提供了同樣的功能.它能讓你將執行環境和配置放在 彙總然後部署,同乙個docker的配置可以在不同的環境環境中使用,這樣就降低了硬體要求和應用環境之間耦合度.從開發者的機器到最終在生產環境上的...

redis的使用場景和優缺點

2 redis用來做什麼?通常侷限點來說,redis也以訊息佇列的形式存在,作為內嵌的list存在,滿足實時的高併發需求。而通常在乙個電商型別的資料處理過程之中,有關商品,熱銷,推薦排序的佇列,通常存放在redis之中,期間也包擴storm對於redis列表的讀取和更新。redis的缺點 是資料庫容...