hive中使用標準sql實現分組內排序

在hive中，想要實現分組內排序，一般都是自己寫udf實現oracle中分析函式row_number() over(partition)的功能，如果不使用自定義udf,僅使用標準sql實現的話，毫無效能可言，僅做實驗而已。

方便起見，以下語句為oracle中語句，但都屬於標準sql,在hive中亦可：

create table lxw_t (user_id varchar2(20),
class varchar2(20),
score number 
);

insert into liuxiaowen.lxw_t values ('user_1','語文','90');
insert into liuxiaowen.lxw_t values ('user_1','數學','86');
insert into liuxiaowen.lxw_t values ('user_1','英語','96');
insert into liuxiaowen.lxw_t values ('user_1','體育','77');
insert into liuxiaowen.lxw_t values ('user_2','語文','88');
insert into liuxiaowen.lxw_t values ('user_2','數學','65');
insert into liuxiaowen.lxw_t values ('user_2','英語','67');
insert into liuxiaowen.lxw_t values ('user_2','體育','98');
commit;

select x.user_id,x.class,x.score,count(1) as seq 
from (
select a.*,b.score score2 from 
liuxiaowen.lxw_t a ,
liuxiaowen.lxw_t b 
where a.user_id = b.user_id (+) 
) x 
where x.score2 >= x.score --按照成績由高到低排列
--where x.score >= x.score2 --按照成績由低到高排列
group by x.user_id,x.class,x.score 
order by 1,4

按照成績由高到低排列的結果如下：

user_id class score seq user_1 英語 96 1 user_1 語文 90 2 user_1 數學 86 3 user_1 體育 77 4 user_2 體育 98 1 user_2 語文 88 2 user_2 英語 67 3

user_2 數學 65 4

按照成績由低到高排列的結果如下：

user_id class score seq user_1 體育 77 1 user_1 數學 86 2 user_1 語文 90 3 user_1 英語 96 4 user_2 數學 65 1 user_2 英語 67 2 user_2 語文 88 3

user_2 體育 98 4

hive中使用標準sql實現分組內排序

在Axapta中使用標準SQL

Hive中使用sql的注意事項

shell中使用SQL實現查詢

hive中使用標準sql實現分組內排序

在Axapta中使用標準SQL

Hive中使用sql的注意事項

shell中使用SQL實現查詢

相關推薦