保序回歸問題

2022-04-07 20:40:00 字數 1326 閱讀 4142

目錄特殊情形下的演算法

設 \(r\) 是集合 \(s\) 上的乙個二元關係,若 \(r\) 滿足:

則稱 \(r\) 為 \(s\) 上的非嚴格偏序關係,記做 \(\le\)。

給定正整數 \(p\),一張點集為 \(v=\\),邊集 \(e(|e|=m)\)的有向無環圖 \(g\) ,及代價函式 \((y,w)(\forall i, w_i>0)\) 。如果在 \(g\) 中有 \(v_i\) 到 \(v_j\) 的有向路徑,那麼就有 \(v_i\le v_j\) 的偏序關係。

求點值序列 \(f\),滿足 \(\forall v_i\le v_j(i,j\in[1,n])\),均有 \(f_i\le f_j\),最小化回歸代價:

\[\sum\limits_^nw_i|f_i-y_i|^p,1\le p\le \infty

\]\[\max\limits_^nw_i|f_i-y_i|,p=\infty

\]對於相同的 \(p\),這一類問題統稱為 \(l_p\) 問題。

definition:將序列 \(z\) 中不超過 \(a\) 的元素變為 \(a\),不小於 \(b\) 的元素變為 \(b\) 稱為序列 \(z\) 向集合 \(s=\\) 取整。

definition:點集 \(u\) 的 \(l_p\) 均值為滿足 \(\sum_w_i|y_i-k|^p(1\le p<\infty)\) 或 \(\max_w_i|y_i-k|(p=\infty)\) 最小的 \(k\)。

給定正整數序列 \(y,w\),求單調不減的實數序列 \(f\),最小化 \(\sum_^nw_i(f_i-y_i)^2,n\le2*10^5\)

lemma:點集 \(u\) 的 \(l_2\) 均值為其加權平均數 \(\fracw_iy_i}w_i}\)

lemma:\(\forall1\le i,如果有 \(y_i>y_\),那麼最優解中一定滿足 \(f_i=f_\)

直接做單調棧即可。

給乙個 \(n\) 個點 \(n-1\) 條邊的有向弱連通圖 \(g=(v,e)\),每個點均有點權 \(d_i\) 和修改耗時 \(w_i\)。對於每個 \(i(1\le i\le n)\),每次修改可以花費 \(w_i\) 的時間把 \(d_i\) 加 \(1\) 或減 \(1\),求最小消耗多少時間,使得 \(\forall(u,v)\in e,d_u\le d_v。n\le3*10^5,1\le d_i\le10^9,1\le w_i\le10^4\)

折線優化 dp 基礎題

筆記 保序回歸問題

保序指保持原來的偏序,在保持給定偏序前提下求一組變數 最擬合給定變數 用數學術語表示,給定偏序集合 s 大小為 n 的集合 x w 求一組大小為 n 變數集合 y 使得對於任意 i,j in s,y le y j 使得 sum limits w i x i y i p 最小。更具體的,我們稱之為 l...

保序回歸求解上公升問題

在乙個圖g gg中。點有給定點權v iv i vi 與需求點權y iy i yi 若存在邊i j i to j i j,那麼有yi yj y i leq y j yi yj 要求最小化 iw i yi vi p sum i w i y i v i p i wi yi vi p。通常的根據p的不同,問...

Spark mllib 保序回歸

從該序列的首元素往後觀察,一旦出現亂序現象停止該輪觀察,從該亂序元素開始逐個吸收元素組成乙個序列,直到該序列所有元素的平均值小於或等於下乙個待吸收的元素。舉例 原始序列 9,10,14 結果序列 9,10,14 分析 從9往後觀察,到最後的元素14都未發現亂序情況,不用處理。原始序列 9,14,10...