Hive 儲存格式入門

2021-10-12 22:55:04 字數 1629 閱讀 6420

textfile: 純文字檔案儲存格式,不壓縮,也是hive的預設儲存格式,磁碟開銷大,資料解析開銷大

第二類:二進位制檔案儲存

>

>

hive.default.fileformatname

>

>

textfilevalue

>

>

expects one of [textfile, sequencefile, rcfile, orc].

default file format for create table statement. users can explicitly override it by create table ... stored as [format]

description

>

property

>

hiev預設用的是textfile,就是說不壓縮

hive> set hive.

default

.fileformat;

hive.

default

.fileformat=textfile

儲存為rcfile測試

create

table emptest

( empno int

, ename string,

job string,

mgr int

, hiredate date

, sal double

, comm double

, deptno int

)row format delimited

fields

terminated

by','

stored as rcfile;

插入資料

insert into emptest

select * from emp;

create

table emptest1

( empno int

, ename string,

job string,

mgr int

, hiredate date

, sal double

, comm double

, deptno int

)row format delimited

fields

terminated

by','

stored as textfile;

insert

into emptest1 select

*from emp;

hive儲存格式

textfile 預設格式,行儲存,匯入資料時直接把資料檔案拷貝到hdfs的hive表目錄 hive location 資料檔案可先經過gzip等壓縮,再導hive表 系統自動檢查,執行查詢時自動解壓 但使用這種方式,hive不會對資料進行切分,從而無法對資料進行並行操作.優點 資料載入快 load...

Hive儲存格式

hive的四種儲存格式 textfile sequencefile rcfile parquet 列式儲存和行式儲存的比較 優點缺點 行式儲存 一行資料是一條記錄,放在同乙個block塊中 只查詢幾個列時,也會讀取整行的資料,當資料量大時,影響效能 方便進行insert update操作 不同型別的...

hive 儲存格式

hive有textfile,sequencefile,rcfile三種檔案格式。textfile為預設格式,建表時不指定預設為這個格式,匯入資料時會直接把資料檔案拷貝到hdfs上不進行處理。sequencefile,rcfile格式的表不能直接從本地檔案匯入資料,資料要先匯入到textfile格式的...