ROI Pooling的作用及意義

2021-10-07 11:14:32 字數 812 閱讀 9845

什麼是roi pooling?

roi pooling 是對(region of interest)進行pooling操作,廣泛應用在物體檢測的研究領域。

該操作的目的是對輸入feature map中的不同大小的roi利用池化方法獲得固定大小的輸出feature map。

roi pooling層的輸入

1,經過基礎網路卷積和池化後的固定大小的特徵圖;

2,表示roi資訊的n*5維的矩陣,其中n表示roi數目,縱座標的第一列表示在輸入特徵圖batch中的索引,之後四位是roi的左上角和右下角座標的資訊。

換個說法,實際上這部分輸入就是rois:指的是rpn層的輸出,一堆矩形框,形狀為1x5x1x1(4個座標+索引index),其中值得注意的是:座標的參考係不是針對feature map這張圖的,而是針對原圖的(神經網路最開始的輸入)。

roi pooling的輸出

輸出是batch個vector,其中batch的值等於roi的個數,vector的大小為channelwh;roi pooling的過程就是將乙個個大小不同的box矩形框,都對映成大小為w*h的矩形框;

舉例:(數字是隨意舉例的,僅僅為了說明道理)

假設輸入的roi大小為8060,期望輸出的roi固定大小為106;

那麼將輸入的roi(8060)劃分為106塊,即每塊的大小為(80/10,60/6)。

對每一塊分別進行最大或者最小pooling操作,即得到了10*6的期望大小的輸出roi。

FormBorderStyle的屬性及意義

formborderstyle的屬性及意義 屬 性 意 義 formborderstyle.none 無邊框formborderstyle.fixedsingle 固定的單行邊框 formborderstyle.fixed3d 固定的三維樣式邊框 formborderstyle.fixeddialo...

ROIPooling和ROIAlign的特點和區別

一 roipooling 這個可以在faster rcnn中使用以便使生成的候選框region proposal對映產生固定大小的feature map 先貼出一張圖,接著通過這 釋roipooling的工作原理 針對上圖 1 conv layers使用的是vgg16,feat stride 32 ...

RoIPooling與RoIAlign的區別

通過對faster rcnn的學習我媽了解的rolpooling可以使生成的候選框region proposal對映產生固定大小的feature map 先貼出一張圖,接著通過這 釋roipooling的工作原理 針對上圖 1 conv layers使用的是vgg16,feat stride 32 ...