VDSR閱讀筆記

2021-09-01 09:22:19 字數 1037 閱讀 2952

vsdr主要解決了從給定的乙個lr影象(一般是指sisr)生成hr影象的問題。sisr廣泛用於計算機視覺應用,從安全和監視成像到醫學成像這些需要更多圖象細節的地方。

由srcnn的作者dong等人所提出的方法成功證明了cnn可以被用來學習lr到hr端到端的對映。但是本篇作者發現srcnn被侷限於三個方面:太過依賴於小影象區域的背景資訊,收斂太慢,而且模型這能用於單縮放倍數,想更換縮放倍數還需要重新訓練。所以在這篇文章裡作者便提出了乙個新的方法用來解決這些問題。

1.如果縮放倍數過大,通常小patch所包含的資訊不夠進行足夠的細節恢復,所以作者所提出的使用大型視野域的vdsr模型非常重視大patch所包含的影象資訊。

2.因為lr和hr影象很大程度上共享相同的資訊,所以明確的對殘差建模是非常有效的。作者提出了乙個輸出和輸入高度對應的有效率的模型,初始學習率是srcnn的

提出srcnn的dong等人曾經嘗試過增加模型深度,但是最後並未得出結論,作者則採用了20層小過濾器深度卷積,取得效果非常不錯。由於每層卷積都有padding操作,所以vdsr輸出影象與輸入影象是相同的,並且由於在所有層使用相同的學習率,vdsr的收斂結果相對穩定。

另外,從srcnn,fsrcnn,espcn到vdsr,因為sr本質就是從lr中找與hr的聯絡,最後生成新的sr,這裡所有的lr圖象都是從原圖中進行下取樣然後得到的低解析度影象,方便對比,目前所有模型的比較方法是psnr(峰值訊雜比)的大小,當然有時候psnr的改變並不會明顯帶來視覺上的明顯區別,甚至會出現psnr得分高而影象噪點多的情況。

作者總結的3個重要點:

1.越深越好:在網路中每層都使用了3×3的過濾器,第一層的視野域是3×3,之後的19層視野域為(2d×1)×(2d×1),尺寸與層的深度成比例

2.殘差學習:首先,作者發現殘差網路收斂非常快,並且可以得到非常高的psnr值,如果使用小學習率,網路將永遠無法達到與0.1相同的效能水平,差距非常大,於是加入了殘差網路計算。(初始學習率設定為0.1,weight decay設定為0.0001)

3.單模型來處理多種縮放倍數:作者用不同的縮放因子訓練模型,最後發現由(×縮放因子)訓練的模型對(×縮放因子)的測試表現更好。

超解析度重構三 VDSR

vdsr accurate image super resolution using very deep convolutional networks 閱讀筆記 1 位址 2 github上tensorflow github上pytorch 3 介紹 3.1 srcnn的缺點 3.2 解決方法 3....

閱讀任務 閱讀筆記 4

功能驅動的設計 1 構造總體模型 2 構造功能列表 3 制定開發計畫 4 功能設計階段 5 實現具體功能 軟體測試按目的分類 1 功能測試 2 非功能測試 軟體測試的各種方法 1 單元測試和 覆蓋率測試 2 構建驗證測試 3 驗收測試 4 探索式的測試 5 回歸測試 6 場景 整合 系統測試 7 夥...

閱讀筆記 2006 01

請您尊重您的價值,因為它已經得到了社會的認可。當你貶低或破壞您的價值時,就等於貶低或破壞整個行業在這個社會的價值。無論在什麼時候,自己都應該尊重自己的價值,而不能因為一時的困境而貶低和破壞了自己的價值,因為你的破壞之舉,將傷害到整個行業的價值乃至社會的規則。因為,唯有懂得尊重自己的價值的人,才能真正...