ROI Pooling層簡單理解

2021-10-09 10:02:51 字數 1486 閱讀 9514

目標檢測typical architecture 通常可以分為兩個階段:

(1)region proposal:給定一張輸入image找出objects可能存在的所有位置。這一階段的輸出應該是一系列object可能位置的bounding box。這些通常稱之為region proposals或者 regions of interest(roi)。

這個architecture存在的一些問題是:

這就是roi pooling提出的根本原因。

roi pooling層能實現training和testing的顯著加速,並提高檢測accuracy。該層有兩個輸入:

roi pooling具體操作如下:

(1)根據輸入image,將roi對映到feature map對應位置;

(2)將對映後的區域劃分為相同大小的sections(sections數量與輸出的維度相同);

(3)對每個sections進行max pooling操作;

這樣我們就可以從不同大小的方框得到固定大小的相應 的feature maps。值得一提的是,輸出的feature maps的大小不取決於roi和卷積feature maps大小。roi pooling 最大的好處就在於極大地提高了處理速度。

roi pooling example

考慮乙個8*8大小的feature map,乙個roi,以及輸出大小為2*2.

(1)輸入的固定大小的feature map

(2)region proposal 投影之後位置(左上角,右下角座標):(0,3),(7,8)。

(3)將其劃分為(2*2)個sections(因為輸出大小為2*2),我們可以得到:

(4)對每個section做max pooling,可以得到:

roi pooling總結:

(1)用於目標檢測任務;(2)允許我們對cnn中的feature map進行reuse;(3)可以顯著加速training和testing速度;(4)允許end-to-end的形式訓練目標檢測系統。

Roi Pooling層caffe原始碼解讀

在看fasterrcnn以及和maskrcnn的時候,發現自己對fasterrcnn的roi pooling層的原理還是不是很明白,之前只是知道roi pooling是將rpn輸出的乙個roi的區域對映成乙個固定大小的map,再送入後面的分類層進行分類。最近看了下roi pooling層的原始碼,頓...

對隱藏層的簡單理解

本文 自 對隱藏層的簡單理解 在多級前饋網當中,隱藏層的定義是 除輸入層和輸出層以外的其他各層叫做隱藏層。隱藏層不直接接受外界的訊號,也不直接向外界傳送訊號。什麼是輸入層呢?和單級網路一樣,該層只起到輸入訊號的扇出作用.所以在計算網路的層數時不被記入。該層負責接收來自網路外部的資訊,被記作第0層。什...

OSI七層模式簡單通俗理解

網路中的七層協議為 應用層 表示層 會話層 傳輸層 網路層 資料鏈路層 物理層。那麼介紹一下在網路七層協議中傳輸資料時的工作原理是 在資料的實際傳輸中,傳送方將資料送到自己的應用層,加上該層的控制資訊後傳給表示層 表示層如法炮製,再將資料加上自己的標識傳給會話層 以此類推,每一層都在收到的資料上加上...