立體匹配演算法之引導濾波代價聚合

2021-08-01 13:56:50 字數 1367 閱讀 3304

本文內容來自於2023年pauline tan以及 pascal monasse在ipol上發表的文章《stereo disparity through cost aggregation with guided filter》,該文獻最主要的貢獻是在區域性立體匹配演算法中

提出了用引導濾波器進行

代價聚合。

由於在畫素到畫素之間直接進行相似度比較會對雜訊十分敏感。所以,每乙個點的匹配代價p(i) = c(i, d)需要進行濾波。自從被設計為具有邊緣保持特性,將i

l作為引導影象的

引導濾波就被採用

進行代價聚合。

記引導圖(導向圖)為g,輸入影象為p,輸出影象為q,引導濾波的目標就是:使得原始的輸入和輸出盡可能相同,同時紋理部分與引導圖g相似。設定前乙個位目標1後乙個為目標2。

於是對於

目標1(

輸入影象p和輸出影象q盡可能相似),可以用公式描述為:

對於目標2(輸出影象q的紋理和引導圖g盡可能相似),用公式描述為:

上式中如果q為單通道影象,g為多通道,那麼a為乙個向量;如果q和g通道數相同,那麼a為標量或者對角矩陣。顯然,a的值越小,最後的輸出影象也就越平滑。

對於目標2,可以對等式兩邊取定積分,從而得到:

將式3代入式1,可以得到能量函式如下:

其中εa2

為正則項,防止a過大。

對能量函式進行求偏導即可

求取a, b。下面結合具體影象視窗對a, b進行求解。

設定影象i作為引導(灰度)影象並且q作為濾波輸出。對於每個視窗ωk,

其半徑為rgf

並且以k為中心(根據定義,半徑為r、邊長2×r + 1並且|ωk|的表示視窗ωk中的畫素數),乙個依賴於引數k的待濾波影象qk

被定義為在視窗ωk

中的i的線性變換: ∃a

k, b

k, ∀i ∈ ω

k,  q

k(i) = a

k· i(i) + bk. 

如果k太靠近影象邊緣,那麼我們只考慮視窗中保留在影象的部分(見下圖)。

在視窗ω

k中,由於ak和b

k是常數,對(1)式求導,所以我們可以寫 ∇q

k= a

k∇i.

也就是說,影象i中的強邊緣意味著q

k中出現強邊緣。 因此,引導濾波器保留了引導影象中的邊緣。為了確定係數a

k和bk,濾波器輸入p和輸出q

k之間的二範數取最小。因此,這個問題的能源方程是:

立體匹配演算法 RankTransform

1.基本介紹 立體匹配演算法,關鍵是計算左右圖對應點的匹配代價。但是基於畫素的匹配方法有乙個問題就是對於重複紋理區域,支援視窗選取太小則不利於獲取準確的匹配代價,視窗選取過大則計算複雜度過高。對於這種情況,我們應該適當的考慮支援視窗的結構資訊,但是結構資訊如何表示,怎樣定量計算,這裡就要用到標題中提...

立體匹配演算法 RankTransform

1.基本介紹 立體匹配演算法,關鍵是計算左右圖對應點的匹配代價。但是基於畫素的匹配方法有乙個問題就是對於重複紋理區域,支援視窗選取太小則不利於獲取準確的匹配代價,視窗選取過大則計算複雜度過高。對於這種情況,我們應該適當的考慮支援視窗的結構資訊,但是結構資訊如何表示,怎樣定量計算,這裡就要用到標題中提...

立體匹配演算法不足

根據不同的標準,立體匹配演算法有不同的分類方法。首先,根據匹配基元的不同,立體匹配演算法可分為 基於區域的匹配演算法,基於特徵的匹配演算法和基於相位的匹配演算法。基於區域的匹配演算法。主要利用左右檢視中,區域性視窗之間灰度資訊的的相關程度進行匹配。該演算法可利用所有的影象資訊,最大限度地恢復場景細節...