hive(2)資料型別和檔案格式

2022-05-17 20:11:39 字數 1324 閱讀 1190

hive支援關係型資料中大多數基本的資料型別,同時也支援關係型資料庫中很少出現的三種集合資料型別。

hive中的列支援使用struct、map、array集合資料型別,下表中的語法示例是呼叫的內建函式。

例如:建立表:

hive>create table emp(name string, salary float, subordinates array, deductions map, address struct

string, city:string, state:string, zip:int>);

下圖表示hive中預設的記錄和字段分隔符

例如:建立表的時候,指定分隔符(示例中的分隔符都是預設的分隔符,如果想要指定其他的分隔符,可以重新設定。)

hive> create table emp(name string, salary float, subordinates array, deductions map, address struct

string, city:string, state:string, zip:int>)

row format delimited

fields terminated by '

\001

'collection items terminated by '

\002

'map keys terminated by '

\003

'lines terminated by '\n'

stored as textfile;

說明:row format delimited(行格式化分隔符)關鍵字需要在其他字句(除stored as...)之前

fields terminated by:字段終止,指定欄位的分隔符

collection items terminated by:集合元素間的分隔符
map keys terminated by:map鍵值之間的分隔符
lines terminated by:指定行分隔符
lines terminated by和stored as 不需要row format delimited關鍵字。

3 資料型別和檔案格式

個人記錄學習,大佬不喜勿噴。hive 支援多種不同長度的整型和浮點型資料型別,支援布林型別,也支援無長度限制的字串型別。hive v0.8.0版本中增加了時間戳資料型別和二進位制陣列資料型別。資料型別 長度例子 tinyint 1byte有符號整數 20smalint 2byte有符號整數 20in...

搜尋資料庫內部資訊和檔案格式

在之前的文章中,我展示過如何用乙個簡單的基於文字格式來儲存記錄,並且對於讀 寫這些記錄又意味著什麼。在這樣乙個系統中搜尋意味著你有相當多的工作要做,因為你需要掃瞄整個檔案。它不會真的為我們工作。所以,我們需要引入索引。索引其實是乙個很簡單的概念。鑑於我們有原始檔案,我們將有以下使用者名稱的索引 基本...

fnm的索引檔案格式的具體結構及資料型別

介紹了.fnm的索引檔案格式的具體結構及資料型別,那麼本篇呢,將介紹另外兩種格式.fdx和fdt。stored field values,代表著儲存欄位的具體的值,對於在索引裡的每乙個文件 document 本質上都是儲存著一系列的基於屬性名和值的k v段,其實也就是欄位的名和字段的值,這一點和大多...