Hive 資料倉儲

2021-09-01 11:33:26 字數 560 閱讀 7432

hive命令列模式:

1、進入bin 執行./hiv

2、配置hive環境變數,直接執行命令:hive --service cli 或 hive

hive的web模式:

執行hive -service hwi 啟動後訪問http://master:9999/hwi

hive的遠端服務:

預設埠:10000,執行啟動命令:nobup hive --service hiveserver2 &

hive資料模型包括表、外部表、分割槽、桶

資料庫操作:建立內錶、建立外表(external關鍵字,刪除表只刪除了元資料資訊,不刪資料)、 建立靜態分割槽表、建立動態分割槽表、建立帶有資料的表 (create table xx as select xx from table)

資料匯入:本地與hdfs匯入、單錶插入、多表插入

資料匯出:匯出資料到本地及hdfs

hiveql查詢:相容大部分sql語法,不支援更新和事務

資料倉儲Hive

資料倉儲是乙個面向主題的 整合的 相對穩定的 反映歷史變化的資料集合,用於支援管理決策。根本目的是為了支援企業內部的商業分析和決策,基於資料倉儲的分析結果,做出相關的經營決策.資料倉儲中的資料比較穩定,保留了大量歷史資料 而資料庫只儲存某一時刻的資料.對於傳統資料倉儲來說,既是資料儲存產品也是分析產...

資料倉儲Hive

乙個公司裡面不同專案可能用到不同的資料來源,有的存在mysql裡面,又的存在mongodb裡面,甚至還有些要做第三方資料。但是現在又想把資料整合起來,進行資料分析。此時資料倉儲 data warehouse,dw 就派上用場了。它可以對多種業務資料進行篩選和整合,可以用於資料分析 資料探勘 資料包表...

hive(資料倉儲工具)

hive是基於hadoop的乙個 資料倉儲工具,可以將結構化的資料檔案對映為一張資料庫表,並提供簡單的sql查詢功能,可以將sql語句轉換為mapreduce任務進行執行。其優點是學習成本低,可以通過類sql語句快速實現簡單的mapreduce統計,不必開發專門的mapreduce應用,十分適合 資...