筆記 保序回歸問題

2022-09-20 18:36:12 字數 699 閱讀 6753

保序指保持原來的偏序,在保持給定偏序前提下求一組變數 $$ 最擬合給定變數 $$。

用數學術語表示,給定偏序集合 $s = $,大小為 $n$ 的集合 $x=,w=$,求一組大小為 $n$ 變數集合 $y=}$,使得對於任意 $(i,j)\in s,y_\le y_j$,使得 $\sum\limits_^w_i(x_i - y_i)^p$ 最小。

更具體的,我們稱之為 $l_p$ 問題。

定義 $l_p$ 均值為使 $\sum\limits_^w_i(x_i - k)^p$ 最小的 $k$。

對於偏序集合為一條單鏈的情況,可以在較優複雜度內完美解決。

$l_1$ 問題模板,偏序集為單鏈。

顯然如果 $x_i \ge x_$,就有 $y_ = y_$,不難理解,假設 $y_i \neq y_$,將兩個數修改至 $l_1$ 均值一定不會更劣。

所以我們用棧維護,滿足條件就合併棧頂,求出新的 $l_1$ 均值。

不難發現 $l_1$ 均值就是加權中位數。

$l_2$ 問題模板,偏序集為單鏈。

這裡的 $y_i$ 表示第 $i$ 列移動到第 $i + 1$ 列時的行號,因為行號和列號不減,所以 $y_i$ 不減,即偏序集為單鏈。

$l_2$ 均值是加權平均數(比 $l_1$ 均值維護起來還方便的多

套用上面的棧維護即可。

對於一般偏序集,可以整體二分求出近似解。

挖坑待填。。。

保序回歸問題

目錄特殊情形下的演算法 設 r 是集合 s 上的乙個二元關係,若 r 滿足 則稱 r 為 s 上的非嚴格偏序關係,記做 le 給定正整數 p 一張點集為 v 邊集 e e m 的有向無環圖 g 及代價函式 y,w forall i,w i 0 如果在 g 中有 v i 到 v j 的有向路徑,那麼就...

保序回歸求解上公升問題

在乙個圖g gg中。點有給定點權v iv i vi 與需求點權y iy i yi 若存在邊i j i to j i j,那麼有yi yj y i leq y j yi yj 要求最小化 iw i yi vi p sum i w i y i v i p i wi yi vi p。通常的根據p的不同,問...

Spark mllib 保序回歸

從該序列的首元素往後觀察,一旦出現亂序現象停止該輪觀察,從該亂序元素開始逐個吸收元素組成乙個序列,直到該序列所有元素的平均值小於或等於下乙個待吸收的元素。舉例 原始序列 9,10,14 結果序列 9,10,14 分析 從9往後觀察,到最後的元素14都未發現亂序情況,不用處理。原始序列 9,14,10...