HIVE使用手冊(四)資料型別

2021-09-07 04:01:36 字數 1390 閱讀 8386

一、概述,包含一些常用的型別

1.數值型別:

tinyint(1位元組有符號整數,從-128至127)

smallint(2位元組有符號整數,從-32,768至32,767)

int / integer(4位元組有符號整數,從-2,147,483,648到2,147,483,647)

bigint(8位元組符號整數,從-9,223,372,036,854,775,808至

9,223,372,036,854,775,807)

float (4位元組單精度浮點數)

double (8位元組雙精度浮點數)

**double precision ( double的別名,僅從 hive 2.2.0開始提供)

decimal

在hive 0.11.0中引入,精度為38位

hive 0.13.0引入了使用者可定義的精度和規模

為sql server、mysql等資料庫的一種資料型別,不屬於浮點 數型別,可以在定義時劃定整數部分以及小數部分的位數。使用精確小數型別不僅能夠保證資料計算更為精確,還可以節省儲存空間,例如百分比使用decimal(4,2)即可。儲存資料範圍是:-10^38~10^38-1 的固定精度和小數字的數字。乙個decimal型別的資料占用了2~17個位元組。

numeric(同樣decimal,從hive 3.0.0開始)

2.日期和時間型別

timestamp(注意:僅從 hive 0.8.0開始提供)

「yyyy-mm-dd hh:mm:ss.fffffffff」(9位小數精度)

date(注意:僅從 hive 0.12.0開始提供)

年/月/日yyyy-­mm-­dd

**interval(注意:僅從hive 1.2.0開始提供)

3.字串型別

string:單引號或者雙引號

varchar(注意:僅從 hive 0.12.0開始提供)

可變長字串,要規定範圍1和65535之間

char(注意:僅從 hive 0.13.0開始提供)

定長字串,最大長度固定在255

4.雜項型別

boolean

binary(注意:僅從 hive 0.8.0開始提供)

5.複雜型別

陣列:( array注意:從hive 0.14開始,允許使用負值和非常量表示式 。)

為何取陣列中的某個元素取不出來

maps :( map注意:從hive 0.14開始,允許使用負值和非常量表示式 。)

通過key查v不行呢

結構: struct

union :( uniontype注意:僅從 hive 0.7.0開始提供。)

查詢col_name.col_name

二、處理null值

缺少的值由特殊值null表示。

hive 的CLI使用手冊

寫的不夠全,後面有時間再補吧 個人漢語水平有限,語言組織平平,見諒 hive cli語言手冊 hive命令列操作 可以使用命令 hive h或.hive help 檢視幫助 為hive0.9.0版使用 usage hive d,define hive中的變數替換應用 e 將hive的命令列不顯示執行...

CVS使用手冊

注意 第一次匯出以後,就不是通過cvs checkout來同步檔案了,而是要進入剛才cvs checkout project name匯出的project name目錄下進行具體檔案的版本同步 新增,修改,刪除 操作。cvs的許可權管理分2種策略 基於系統檔案許可權的系統使用者管理 適合多個在lin...

sed使用手冊

原貼 http blog.chinaunix.net u 23204 showart 305602.html sed使用手冊 原創 在sed語句,正規表示式必須封閉在 中間。如 d,刪除空行。sed位址 在sed位址管理中,預設是對全域性進行操作,同時位址可以分為行位址和模式位址。如1,10d 12...