骨架網路(Backbone)之 空洞卷積

2021-10-25 10:36:21 字數 853 閱讀 7709

空洞卷積

空洞卷積最初是為解決影象分割的問題而提出的。常見的影象分割演算法通常使用池化層來增大感受野,同時也縮

小了特徵圖尺寸,然後再利用上取樣還原影象尺寸。特徵圖縮小再放大的過程造成了精度上的損失,因此需要有

一種操作可以在增加感受野的同時保持特徵圖的尺寸不變,從而替代池化與上取樣操作,在這種需求下,空洞卷

積就誕生了。

優點
空洞卷積的優點顯而易見,在不引入額外引數的前提下可以任意擴大感受野,同時保持特徵圖的解析度不變。

這一點在分割與檢測任務中十分有用,感受野的擴大可以檢測大物體,而特徵圖解析度不變使得物體定位更

加精準。

缺點
* 網格效應(gridding effect):由於空洞卷積是一種稀疏的取樣方式,當多個空洞卷積疊加時,有些畫素根

本沒有被利用到,會損失資訊的連續性與相關性,進而影響分割、檢測等要求較高的任務。

進而影響分類的結果。

*不同尺度物體的關係:大的dilation rate對於大物體分割與檢測有利,但是對於小物體則有弊無利,如何處

理好多尺度問題的檢測,是空洞卷積設計的重點。

目前解決方法
典型的有圖森未來提出的hdc(hybrid dilated convolution)結構。該結構的設計準則是堆疊卷積的

dilation rate不能有大於1的公約數,同時將dilation rate設定為類似於[1,2,5,1,2,5]這樣的鋸齒類結構。此外

各dilation rate之間還需要滿足乙個數學公式,這樣可以盡可能地覆蓋所有空洞,以解決網格效應與遠距離信

息的相關性問題,具體細節可參考相關資料。

深度學習 深度網路 backbone 含義

q 深度學習的 中網路都會有backbone,這個是什麼意思呢?關注用的什麼backbone意義是什麼呢?比如某篇 backbone用的resnet,這代表什麼呢?a backbone這個單詞原意指的是人的脊梁骨,後來引申為支柱,核心的意思。在神經網路中,尤其是cv領域,一般先對影象進行特徵提取 常...

基於骨架的動作識別AGC LSTM網路(一)

摘要 目前研究的主要挑戰 怎麼有效的提取具有辨別性的空間和時間特徵 因此提出了 注意力增強圖卷積lstm網路 agc lstm agc lstm不僅可以捕捉空間配置和時間動態的判別特徵,而且可以捕捉時間域和空間域的共現關係 此外提出了時間層次結構來增強最高層agc lstm層的時間感受域,從而提高了...

池化和空洞卷積 1 卷積神經網路相關

1.1卷積的基本操作與全連線層的區別 區域性連線 權值共享 滑動 權值一致 輸入輸出資料結構化 保留結構 1.2感受野大小計算 感受野定義 某層的特徵上的乙個點,cnn的原始輸入上能夠影響這一點取值的範圍的區域。上一層的感受野加上當前 卷積核的尺寸 1 前面每層的步長,然後和資料區域大小作比較。1....