Hive高階聚合函式

2021-12-30 08:53:47 字數 1002 閱讀 9581

0、基礎知識

(1)pv:page view(頁面訪問量)

(2)uv:user view(訪問人數)

(3)uv表的資料如下

(4)統計每個月的使用者瀏覽量,"distinct"關鍵字是去除重複的值

select month, count(distinct id) from uv group by month;

1、union all:表聯合操作

eg:統計每天和每月的使用者訪問量

select month, count(distinct id) from uv group by month union all select day, count(distinct id) from uv group by day;

2、grouping sets:只統計指定字段

eg:統計每天和每月的使用者訪問量,grouping__id是分組的組號(兩個下劃線)

select month, day, count(distinct id), grouping__id from uv group by month, day grouping sets(month, day);

3、with cube:統計指定欄位的所有組合(包括null)

eg:統計每天和每月的使用者訪問量,grouping__id是分組的組號(兩個下劃線)

select month, day, count(distinct id), grouping__id from uv group by month, day with cube order by grouping__id;

4、with rollup:逐層統計指定字段

eg:統計每天和每月的使用者訪問量,grouping__id是分組的組號(兩個下劃線),組號扔按所有組合排序,但只顯示逐層統計的記錄

select month, day, count(distinct id), grouping__id from uv group by month, day with rollup order by grouping__id;

Hive高階聚合函式

基礎知識 1 pv page view 頁面訪問量 2 uv user view 訪問人數 3 uv表的資料如下 4 統計每個月的使用者瀏覽量,distinct 關鍵字是去除重複的值 select month,count distinct id from uv group by month 1 un...

Hive高階聚合函式 group by擴充套件

目錄 指定多種聚合的維度 層次,對多個group by union all進行替換 簡化 可實現從右到左遞減多級的統計,顯示統計某一層次結構的聚合 可以實現多個任意維度的查詢,會統計所選列中值的所有組合的聚合 按照一定規則給統計的各維度組合打標,並返回標識值。1.group by擴充套件 group...

Hive 聚合函式

用途 計算總體標準差 格式 t stddev t,t,t,用途 計算樣本標準差 格式 t stddev samp t,t,t,用途 返回組內某個數字列的方差 介面格式 double variance column name 用途 返回組內某個數字列的方差 介面格式 double var pop co...