Scala之視窗函式排序

2021-10-06 13:42:59 字數 1524 閱讀 5557

scala視窗函式這排序rank,重複排序和不重複排序

1、引入包

import org.apache.spark.sql.expressions.window

import spark.implicits._

2.建立測試的df,可以直接貼上測試。

3.選擇按name分組,按score排序,且倒序。

val bynamescoredesc = window.

partitionby

("name").

orderby

(col

("score"

).desc)

4.將序號新增一列到測試的testdf。這裡使用了不重複排序。

5.將序號新增一列到測試的testdf。這裡使用了並列排序。

6.只選取唯一name的記錄。

Hive之視窗函式

對一定視窗期內的資料進行聚合。示例 select sum a.pv over partition by cookieid order by create time rows between 3 preceding and current row as pv1,sum a.pv over partit...

hive sql之 視窗函式。

一 row number 函式 區別於其它排序函式,相當於多了乙個排序的列。資料準備 name money ming 12 yang 23 ming 35 ming 54 yang 43 1 按照其中money 進行排序並增加一行。select name,money,row number over ...

SQL知識之視窗函式

3 排序視窗函式 4 切分視窗函式 5 偏移視窗函式 6 first value last value 前言 視窗函式屬於sql的高階查詢功能,有些資料庫的低版本可能還不支援,如mysql5.7版本暫不支援,sql server是支援的。1 視窗函式的簡單介紹 2 累計計算視窗函式 2.1 普通累計...