hive 建立表詳解

2021-07-15 01:30:02 字數 885 閱讀 5266

hive> create table studyinfo(id int, age int)

> row format delimited

> fields terminated by ','

> stored as textfile;

oktime taken: 2.666 seconds

[row formatdelimited]關鍵字,是用來設定建立的表在載入資料的時候,支援的列分隔符;

create table  user_info (user_id int, cid string, ckid string, username string) 

row format delimited 

fields terminated by '\t'

lines terminated by '\n';

匯入資料表的資料格式是:字段之間是tab鍵分割,行之間是斷行。

及要我們的檔案內容格式:

100636  100890  c5c86f4cddc15eb7        yyyvybtvt

100612  100865  97cc70d411c18b6f        gyvcycy

100078  100087  ecd6026a15ffddf5        qa000100

[stored as file_format]關鍵字是用來設定載入資料的資料型別。

hive本身支援的檔案格式只有:textfile,sequence file。

如果檔案資料是純文字,可以使用 [stored as textfile]。

如果資料需要壓縮,使用[stored as sequence] 。

通常情況,只要不需要儲存序列化的物件,我們預設採用[stored as textfile]。

hive創標 hive建立表

一 為什麼要建立分割槽表 1 select查詢中會掃瞄整個表內容,會消耗大量時間。由於相當多的時候人們只關心表中的一部分資料,故建表時引入了分割槽概念。2 hive分割槽表 是指在建立表時指定的partition的分割槽空間,若需要建立有分割槽的表,需要在create表的時候呼叫可選引數partit...

Hive建立外部表

hive建立外部表 1.環境需求 hadoop 2.6.0 hive 1.2.1 hue 3.7.0 2.開發過程 1 建立hdfs目錄 hadoop dfs mkdir wy input 2 上傳本地資料到hdfs中 hadoop dfs put usr wy writing.txt wy inp...

HIVE建立外部表

基礎建表語句 create external table if not exists table name col name data type comment col comment comment table comment partitioned by col name data type c...