hive中的三種建表方法

2021-10-08 07:06:12 字數 1800 閱讀 4519

create [external] table [if not exists] employee_external (    //external關鍵字新增為外部表

name string,

work_place array,

***_age struct,

skills_score map,

depart_title map>

)comment 'this is an external table' //對錶的注釋

row format delimited

fields terminated by '|' //如何分隔列(字段)

collection items terminated by ',' //如何分隔集合和對映

map keys terminated by ':'

stored as textfile //檔案儲存格式

location '/user/root/employee'; // 資料儲存路徑(hdfs)

準備資料

建表

create table if not exists test1(

id int,

name string

)row format delimited

fields terminated by ',';

裝載資料

load data local inpath '/data/test.txt' overwrite into table test1;
檢視表

建表完成

將一條查詢語句的結果作為乙個表的內容建立

建表語句

create table 表名 as 查詢語句;
建表

create table test2 as select * from test1;
檢視表2

該方法只能建立表的結構 不能建立資料

建表語法

creat table 表名 like 現有表的表名;
建表

create table test3 like test1;
檢視表

並沒有資料

通過desc命令檢視表的狀態

只有表結構 表資料需要後期再次新增

Hive中join的三種方式

hive在實際的應用過程中,大部份分情況都會涉及到不同的 的連線,例如在進行兩個table的join的時候,利用mr的思想會消耗大量的記憶體,良妃磁碟的io,大幅度的影響效能,因為shuffle真的好令人擔心啊,總之,就是各種問題都是由他產生的。下面介紹一下涉及hive在join的時候的優化方式 第...

hive多個表join Hive的三種Join方式

hive的三種join方式 hive common shuffle reduce join reduce join在hive中也叫common join或shuffle join 如果兩邊資料量都很大,它會進行把相同key的value合在一起,正好符合我們在sql中的join,然後再去組合,如圖所示...

Hive設定引數的三種方法

hive提供三種可以改變環境變數的方法 1.修改 conf hive site.xml配置檔案 在hive中,所有的預設配置都在 conf hive default.xml檔案中,如果需要對預設的配置進行修改,可以建立乙個hive site.xml檔案,放在 conf目錄下。裡面可以對一些配置進行個...