VDSR閱讀筆記

vsdr主要解決了從給定的乙個lr影象（一般是指sisr）生成hr影象的問題。sisr廣泛用於計算機視覺應用，從安全和監視成像到醫學成像這些需要更多圖象細節的地方。

由srcnn的作者dong等人所提出的方法成功證明了cnn可以被用來學習lr到hr端到端的對映。但是本篇作者發現srcnn被侷限於三個方面：太過依賴於小影象區域的背景資訊，收斂太慢，而且模型這能用於單縮放倍數，想更換縮放倍數還需要重新訓練。所以在這篇文章裡作者便提出了乙個新的方法用來解決這些問題。

1.如果縮放倍數過大，通常小patch所包含的資訊不夠進行足夠的細節恢復，所以作者所提出的使用大型視野域的vdsr模型非常重視大patch所包含的影象資訊。

2.因為lr和hr影象很大程度上共享相同的資訊，所以明確的對殘差建模是非常有效的。作者提出了乙個輸出和輸入高度對應的有效率的模型，初始學習率是srcnn的

提出srcnn的dong等人曾經嘗試過增加模型深度，但是最後並未得出結論，作者則採用了20層小過濾器深度卷積，取得效果非常不錯。由於每層卷積都有padding操作，所以vdsr輸出影象與輸入影象是相同的，並且由於在所有層使用相同的學習率，vdsr的收斂結果相對穩定。

另外，從srcnn，fsrcnn，espcn到vdsr，因為sr本質就是從lr中找與hr的聯絡，最後生成新的sr，這裡所有的lr圖象都是從原圖中進行下取樣然後得到的低解析度影象，方便對比，目前所有模型的比較方法是psnr（峰值訊雜比）的大小，當然有時候psnr的改變並不會明顯帶來視覺上的明顯區別，甚至會出現psnr得分高而影象噪點多的情況。

作者總結的3個重要點：

1.越深越好：在網路中每層都使用了3×3的過濾器，第一層的視野域是3×3，之後的19層視野域為（2d×1）×（2d×1），尺寸與層的深度成比例

2.殘差學習：首先，作者發現殘差網路收斂非常快，並且可以得到非常高的psnr值，如果使用小學習率，網路將永遠無法達到與0.1相同的效能水平，差距非常大，於是加入了殘差網路計算。（初始學習率設定為0.1，weight decay設定為0.0001）

3.單模型來處理多種縮放倍數：作者用不同的縮放因子訓練模型，最後發現由（×縮放因子）訓練的模型對（×縮放因子）的測試表現更好。

VDSR閱讀筆記

超解析度重構三 VDSR

閱讀任務閱讀筆記 4

閱讀筆記 2006 01

VDSR閱讀筆記

超解析度重構三 VDSR

閱讀任務 閱讀筆記 4

閱讀筆記 2006 01

相關推薦

閱讀任務閱讀筆記 4