使用python連線hive(親測有用 )

2021-10-25 20:07:09 字數 868 閱讀 1102

本來想將hive中的資料用python進行視覺化,在連線時出現了許多問題,特此記錄一下~~~

pip install sasl

pip install thrift

pip install thrift-sasl

pip install pyhive

在linux端啟動hadoop並在任意目錄下輸入:hive --service hiveserver2 啟動服務

在連線的過程中會出現錯誤或者卡住動不了

1.需要在 hive.connection中加入auth='nosasl』引數

from pyhive import hive #匯入包

conn = hive.connection(host=

'ip位址'

,port=

10000

,username=

'***'

,database=

'house'

,auth=

'nosasl'

)#

2.在hive-site.xml中新增hiveserver2 的模式

>

>

hive.server2.authenticationname

>

>

nosaslvalue

>

property

>

重啟hive,大功告成!!!

python連線hive 親測有效

背景 python裡連線hive對應的包是pyhive,但根據hive客戶端的不同的需要引用不同的子模組。部門在hive安裝了hiveserver2,並在centos執行,但在連線的時候出現錯誤module six has no attribute ensure binary 解決問題後進行記錄。1...

python連線hive配置

注 python端所在伺服器為centos6.8 參考博文 重要一點,hive是個客戶端,不是集群,在hive所在節點必須執行如下命令 hive service hiveserver2 參考博文 注 客戶端指的是裝有anaconda的python環境的linux機器,並非裝有hive的機器 以下涉及...

python連線hive配置

注 python端所在伺服器為centos6.8 重要一點,hive是個客戶端,不是集群,在hive所在節點必須執行如下命令 hive service hiveserver2 二,訪問hive的客戶端 以下涉及所有包,1 yum install gcc c 2 yum install python ...