HIVE倉庫擴充套件 連線hive資料庫

2021-09-10 07:47:00 字數 779 閱讀 9472

一、命令列客戶端工具:

hivecli 

cli是和hive互動的最簡單/最常用方式,你只需要在乙個具備完整hive環境下的shell終端中鍵入hive即可啟動服務。

beeline

beeline是hive新的命令列客戶端工具。

hive客戶端工具後續將使用beeline 替代hivecli ,並且後續版本也會廢棄掉hivecli 客戶端工具。

beeline是從 hive 0.11版本引入的。

beeline工作模式有兩種,即本地嵌入模式和遠端模式。嵌入模式情況下,它返回乙個嵌入式的hive(類似於hive cli)。而遠端模式則是通過thrift協議與某個單獨的hiveserver2程序進行連線通訊。

下面給乙個簡單的登入beeline的使用例項:

退出beeline命令列則是!quit, 很多命令都是前面需要加乙個感嘆號, 但對於登入了後的ddl,dml,則直接執行sql語句即可,語句後帶上乙個分號,然後回車執行。

二、python遠端連線:

需要裝包:

pip install impyla

pip install thrift==0.9.3

from impala.dbapi import connect

def connhive():

conn = connect(host='192.168.1.54', port=10000, auth_mechanism='plain', user='hdfs', password='hdfs')

cur = conn.cursor()

使用PyHive連線Hive資料倉儲

pyhive是python語言編寫的用於操作hive的簡便工具庫。from pyhive import hive conn hive.connection host 192.168.0.1 port 10000 auth custom database gld username hive passw...

Hive 資料倉儲

hive命令列模式 1 進入bin 執行.hiv 2 配置hive環境變數,直接執行命令 hive service cli 或 hive hive的web模式 執行hive service hwi 啟動後訪問http master 9999 hwi hive的遠端服務 預設埠 10000,執行啟動命...

資料倉儲Hive

資料倉儲是乙個面向主題的 整合的 相對穩定的 反映歷史變化的資料集合,用於支援管理決策。根本目的是為了支援企業內部的商業分析和決策,基於資料倉儲的分析結果,做出相關的經營決策.資料倉儲中的資料比較穩定,保留了大量歷史資料 而資料庫只儲存某一時刻的資料.對於傳統資料倉儲來說,既是資料儲存產品也是分析產...