Hive 基礎入門

2021-09-25 17:01:05 字數 1319 閱讀 5783

官方定義:the apache hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using sql.

即:hive是一種用類sql語句來協助讀寫、管理那些儲存在分布式儲存系統上大資料集的資料倉儲軟體

hive作為hadoop的乙個資料倉儲工具,hive可以將結構化的資料檔案對映為一張資料庫表,並提供簡單的sql查詢功能。如若像我一樣暫不需要深入接觸大資料的話,了解hive是hadoop的乙個資料倉儲工具,提供大資料sql查詢功能,並且hivesql語法類似sql。

資料型別長度備註,例子

tinyint

1位元組的有符號整數

-128~127,20

smallint

1個位元組的有符號整數

-32768~32767,20

int4個位元組的有符號整數

-2147483648 ~ 2147483647,20

bigint

8個位元組的有符號整數

,20boolean

布林型別,true或者false

true、false,true

float

單精度浮點數

,3.14159

double

雙精度浮點數

,3.14159

string

字串,'hello word' "hello word "

timestamp

整數支援unix timestamp,可以達到納秒精度

binary

位元組陣列

date

日期0000-01-01 ~ 9999-12-31,常用string代替

------

struct

類似 『物件』

struct('john','doe')

map一組鍵-值對元組組合

map('first','join','last','doe')

array

陣列是一組具有相同型別對和名稱對變數對集合。

array('john','doe')

------

hive本身可能就是為了讓會sql的人快速使用hadoop進行資料操作,所以hivesql和sql語法大體一致,遇到不同的地方再補充。

hive基礎入門

現在還沒有上專案,就將自己以前自學大資料裡關於hive方面基礎的東西整理拉下,也算是對學過的知識的一種複習,順便分享出來與各位大佬共勉,有問題的話請不吝賜教。建立分割槽表 create external table if not exists log empno int,ename string,j...

Hive 學習記錄 入門基礎

一 常用ddl 建表 create external table if not exists table name col name data type comment col comment comment table comment partitioned by col name data ty...

Hive使用入門

先介紹一些基本的命令 1 進入hive命令列,這種方式進入之後,操作結果展示時帶有執行mapreduce的除錯資訊 hive service cli 等同於直接輸入hive 2 進入hive命令列靜默模式,不輸出除錯資訊 hive s 靜默模式 3 檢視表資訊,檢視函式資訊,檢視表字段資訊,每一條h...