關於FPN的三個疑問

2021-10-04 06:41:54 字數 1028 閱讀 3276

cvpr 現場提問

1、不同深度的 feature map 為什麼可以經過 upsample 後直接相加

a:作者解釋說這個原因在於我們做了 end-to-end 的 training,因為不同層的引數不是固定的,不同層同時給監督做end-to-end training,所以相加訓練出來的東西能夠更有效地融合淺層和深層的資訊。(通過訓練引數,可以達到融合淺層和深層資訊的目的

2、為什麼 fpn 相比去掉深層特徵 upsample(bottom-up pyramid) 對於小物體檢測提公升明顯?(rpn 步驟 ar 從 30.5 到 44.9,fast rcnn 步驟 ap 從 24.9 到 33.9)

a:對於小物體,一方面它提高了小目標的解析度資訊;另一方面,如圖中的挎包一樣,從上到下傳遞過來的更全域性的情景資訊可以更準確判斷挎包的存在及位置。(提高小目標檢測精度,需要高解析度和全域性的情景資訊,fpn使得二者兼得

3、如果不考慮時間情況下,image pyramid是否可能會比 feature pyramid 的效能更高?

a:作者覺得經過精細調整訓練是可能的,但是 image pyramid 主要的問題在於時間和空間占用太大,而 feature pyramid可以在幾乎不增加額外計算量情況下解決多尺度檢測問題。(模型簡單,速度快和空間小優先選擇

關於三個作者

因歷史原因,本blog專欄名字叫做fudan abc,但時過境遷,如今blog維護者已不僅僅是復旦人,一名交大才子加入了這支革命隊伍.昨天 兩個曾經的復旦人,復旦人甲和復旦人乙.今天 兩個曾經的復旦人,復旦人甲和復旦人乙.乙個曾經的交大人,交大人甲.復旦人甲目前主要寫uhci驅動的分析.分析的是2....

關於dubbo的三個問題

dubbo是乙個分布式服務框架,致力於提供高效能和透明化的rpc遠端服務呼叫方案,以及soa服務治理方案。其核心部分包括 遠端通訊 提供對多種基於長連線的nio框架抽象封裝,包括多種執行緒模型 序列化 請求 響應 模式的資訊交換方案 集群容錯 提供基於介面方法的透明遠端過程呼叫,包括多協議支援 軟負...

關於工資的三個秘密

作為職業規劃師,我想告訴你關於工資的乙個秘密,年薪月薪是相當有欺騙性的東西。真正起作用的,是時薪 你一定要看看自己的單位時間是否更加值錢。第一條關於工資的原則是,工資不等於月薪,也不等於年薪,工資等於時薪。第二個故事也很好玩。乙個朋友結婚,和丈夫買了個北京市二環內的房子。房子有100平公尺,每平公尺...