各向同性,各向異性縮放

2021-08-19 19:36:21 字數 742 閱讀 8732

r-cnn的**中提到了各向同性,各向異性縮放的概念,這裡做乙個詳細解釋:

當我們輸入一張時,我們要搜尋出所有可能是物體的區域,r-cnn採用的就是selective search方法,通過這個演算法我們搜尋出2000個候選框。然後從r-cnn的總流程圖中可以看到,搜出的候選框是矩形的,而且是大小各不相同。然而cnn對輸入的大小是有固定的,如果把搜尋到的矩形選框不做處理,就扔進cnn中,肯定不行。因此對於每個輸入的候選框都需要縮放到固定的大小。

下面我們講解要怎麼進行縮放處理,為了簡單起見我們假設下一階段cnn所需要的輸入大小是個正方形227*227。因為我們經過selective search 得到的是矩形框,*****試驗了兩種不同的處理方法:

這種方法很簡單,就是不管的長寬比例,管它是否扭曲,進行縮放就是了,全部縮放到cnn輸入的大小227*227,如下圖(d)所示;

直接在原始中,把bounding box的邊界進行擴充套件延伸成正方形,然後再進行裁剪;如果已經延伸到了原始的外邊界,那麼就用bounding box中的顏色均值填充;如下圖(b)所示;

對於上面的異性、同性縮放,文獻還有個padding處理,上面的示意圖中第1、3行就是結合了padding=0, 第2、4行結果圖採用padding=16的結果。經過最後的試驗,作者發現採用各向異性縮放、padding=16的精度最高。(也就是最後乙個圖)

各向異性擴散

主要是用來平滑影象的,克服了高斯模糊的缺陷,各向異性擴散在平滑影象時是保留影象邊緣的 和雙邊濾波很像 通常我們有將影象看作矩陣的,看作圖的,看作隨機過程的,記得過去還有 看作力場的。這次新鮮,將影象看作熱量場了。每個畫素看作熱流,根據當前畫素和周圍畫素的關係,來確定是否要向周圍擴散。比如某個鄰域畫素...

各向異性擴散

主要是用來平滑影象的,克服了高斯模糊的缺陷,各向異性擴散在平滑影象時是保留影象邊緣的 和雙邊濾波很像 通常我們有將影象看作矩陣的,看作圖的,看作隨機過程的,記得過去還有 看作力場的。這次新鮮,將影象看作熱量場了。每個畫素看作熱流,根據當前畫素和周圍畫素的關係,來確定是否要向周圍擴散。比如某個鄰域畫素...

3DCT 各向同性

各向同性 也叫 立方體畫素 是指畫素的長寬高都相等的情況。在螺旋ct沒有出現之前,談到 畫素 一般僅僅指畫素的長寬值,而忽略了畫素的高度。但是,正如我們常做的比喻 ct斷面就象一片片的麵包 而 麵包片 實際上是有厚度的,所以 畫素 的確切說法應該是 畫素體 具有長寬高。螺旋ct出現以後,可以進行體積...