hive 臨時表 with HIVE的多表查詢

2021-10-18 16:55:40 字數 2829 閱讀 5940

先來看看union all語句的使用

union all語句將倆個表中相同的字段拼接在一起進行表的查詢,注意的是union all不去重,資料會重複,我們來看看網路上的一些案例~

--準備表create external table if not exists temp_uniontest_ta(a1 string,a2 string)partitioned by (dt string)row format delimited fields terminated by '\t'stored as textfile;alter table temp_uniontest_ta add if not exists partition (dt = '2014-10-13') location '/temp/uniontest/ta/';a1  a2  2014-10-13b1  b2  2014-10-13c1  c2  2014-10-13 create external table if not exists temp_uniontest_tb(a1 string,a2 string)partitioned by (dt string)row format delimited fields terminated by '\t'stored as textfile;alter table temp_uniontest_tb add if not exists partition (dt = '2014-10-13') location '/temp/uniontest/tb/';d1  d2  2014-10-13e1  e2  2014-10-13
-- 進行union all查詢select * from (select a1,a2 from temp_uniontest_ta where dt = '2014-10-13'union allselect a1,a2 from temp_uniontest_tb where dt = '2014-10-13') tmp;a1  a2b1  b2c1  c2d1  d2e1  e2
上面是我們的union all連線,接下來我們看看hive的join連線

在這裡要注意的是hive只支援等值連線(equality joins)、外連線(outer joins)和(left/right joins)。hive 不支援所有非等值的連線,因為非等值連線非常難轉化到 map/reduce 任務。另外,hive 支援多於 2 個表的連線。join關聯查詢例項如下:

innser join(join)查詢

left outer join(left join)查詢

full outer join(full join)查詢

left semi join查詢

hive中不支援exist/in子查詢,可以用left semi join來實現同樣的效果:

注意: left semi join的 select子句中,不能有右表的字段



with q1 as ( select key from q2 where key = '5'),q2 as ( select key from src where key = '5')select * from (select key from q1) a;--上述**中q1是一張表,q2也是一張表,這樣我們就可以講複雜的sql語句簡化一部分,個人覺得特別好用
--插入操作例項create table s1 like src;with q1 as ( select key, value from src where key = '5')from q1insert overwrite table s1select *;
基礎的語法就如上所示啦,在實際應用中我們一般會將with,union all,if,統計函式,group by 等結合起來一起操作,一條sql56十行都是正常的,所以建議大家打好基礎方便後期的使用~~~~


