Hbase與Hive的區別

2021-08-21 02:59:50 字數 1004 閱讀 5847

一、hbase與hive的對比

hive和hbase有各自不同的特徵:hive是高延遲、結構化和面向分析的,hbase是低延遲、非結構化和面向程式設計的。hive資料倉儲在hadoop上是高延遲的。

其中hbase位於結構化儲存層,hadoop hdfs為hbase提供了高可靠性的底層儲存支援,hadoop mapreduce為hbase提供了高效能的計算能力,zookeeper為hbase提供了穩定服務和failover機制。

通過hive的儲存介面,hive和hbase可以整合使用。

1) hive

(1) 資料倉儲

hive的本質其實就相當於將hdfs中已經儲存的檔案在mysql中做了乙個雙射關係,以方便使用hql去管理查詢。

(2) 用於資料分析、清洗

hive適用於離線的資料分析和清洗,延遲較高。

(3) 基於hdfs、mapreduce

hive儲存的資料依舊在datanode上,編寫的hql語句終將是轉換為mapreduce**執行。

2) hbase

(1) 資料庫

是一種面向列儲存的非關係型資料庫。

(2) 用於儲存結構化和非結構話的資料

適用於單錶非關係型資料的儲存,不適合做關聯查詢,類似join等操作。

(3) 基於hdfs

資料持久化儲存的體現形式是hfile,存放於datanode中,被resionserver以region的形式進行管理。

面對大量的企業資料,hbase可以直線單錶大量資料的儲存,同時提供了高效的資料訪問速度。

Hive與Hbase的區別

以下 由網上內容 整理 hive是為了簡化編寫mapreduce程式而生的,使用mapreduce做過資料分析的人都知道,很多分析程式除業務邏輯不同外,程式流程基本一樣。在這種情況下,就需要hive這樣的使用者程式設計介面。hive本身不儲存和計算資料,它完全依賴於hdfs和mapreduce,hi...

hive與hbase的區別

hive與hbase的區別 hive 核心將sql轉換為mapreduce 將儲存在hdfs上的結構化的資料對映成一張表,並提供類sql語句進行查詢 hive的特點 高延遲儲存的是結構化的資料 hive是面向分析,使用的hql語言 hive不能接入業務使用 hive是面向行儲存的資料倉儲工具,是一種...

Hbase與hive的區別

hive是乙個構建在hadoop 基礎之上的資料倉儲。通過hive可以使用hql語言查詢存放在hdfs 上的資料。hql是一種類sql語言,這種語言最終被轉化為map reduce.雖然hive提供了sql查詢功能,但是hive 不能夠進行互動查詢,因為它只能夠在haoop上批量的執行hadoop。...