hive的基本使用

2021-08-08 08:49:57 字數 1482 閱讀 3114

大資料平台架構

基於hadoop的乙個資料倉儲工具,構建於hadoop的hdfs和mapred之上,用於管理和查詢結構化/非結構化資料的資料倉儲。可以將結構化的資料檔案對映為一張資料庫表,並提供類sql查詢功能。

hive將hql語句轉譯成m/r job,然後按照mr的計算框架在hadoop執行,也可以把hql中的表、字段轉換為hdfs中的檔案(夾)以及檔案中的列。這套對映工具稱之為metastore

hive的表其實就是hdfs的目錄,按表名把資料夾分開。如果是分割槽表,則分割槽值是子資料夾,可以直接在m/r job裡使用這些資料。
hive作用

hvie降低了資料人員使用mr的門檻,使得分布式計算通過類sql的操作即可實現,對大資料應用發展起到了很多的推動作用。

本質是將hql轉換為mapreduce程式的工具;不屬於google核心**內容。(dfs、mr、bigtable);由facebook開發並開源。

特點:

共同點

區別連線bigdata 元資料庫

例如:

從/usr/local/hive/conf/hive-site.xml找connectionusername和connectionpassword(hive/hive2017)

跳到bigdata003

mysql -u hive -phive2017 -d hive

檢視hive版本:

mysql> select * from version;

檢視有哪些表:

mysql> select * from tbls \g;

檢視表對應的hdfs目錄的metedata:

mysql> select * from sds \g;

檢視某個表的partitions:

mysql> select * from partitions where tbl_id=1 \g;

檢視某個表的列:

mysql> select * from columns_v2;

檢視某個表的partition:

一些基本操作:

Hive基本使用

啟動hadoop sbin start all.sh 啟動hive bin hive 建立表 create table table name col name data type comment col comment create table hive wordcount context stri...

HIVE基本使用

筆者注 這裡安裝的版本為hive 0.13.1 注 表示可選 create database if not exists db hive use db hive drop database if exists db hive create table stu id int name string r...

Hive基本使用

hive基本使用 庫操作 建立庫 進入終端 beeline u jdbc hive2 n user 判斷是否存在並新增注釋 create database if not exists zxl test comment hive test 新增屬性 create database if not exi...