6D位姿識別 BB8

2021-10-21 17:53:05 字數 2619 閱讀 6242

2 **三維位姿

3 旋轉對稱物體的位姿估計

這一階段的任務是在影象中識別物體的中心點,分為兩個階段:

將尺寸為512×

\times

× 384的影象分割為128×

\times

× 128大小的影象塊;

將影象塊輸入到vgg分類網路(將最後全連線層的輸出改為16×16

=256

16\times 16=256

16×16=

256)中,得到每個8×

\times

× 8影象塊的分類結果,這裡為二分類,即決定是物體還是背景;

大於設定閾值的8×

\times

× 8影象塊為物體

將包含最大物體區域的影象部分resize為16×16

16\times 16

16×1

6大小,輸入到第二個網路,得到精細化的分割;

網路只有兩個卷積層和兩個池化層,輸出結果同粗分割時類似;

根據精細化分割的結果得到bbox,進而得到物體的中心點。

根據第一階段分割的結果------即影象中感興趣物體的中心點位置,crop出以該點為中心的影象塊輸出到這一階段的網路(同為vgg),輸出為物體在三維場景中3d bbox八個角點在影象上的投影點座標,根據這8組3d-2d的對應點,求解pnp可以得到物體的6d位姿。

bb8在處理旋轉對稱物體的方法很有代表性,下面是本人結合原**對該方法的理解。

原文的3.3小節中詳細地描述了處理對稱物體地方法,我這裡先簡單總結一下:

首先,對於訓練集中的對稱物體,識別它的對稱角度(angle of symmetry),如上圖(a)中所以物體如果忽略圓環上小的突出,可以簡單 理解為乙個對稱角度為180°的物體(也即保持相機的拍攝位姿不變,物體圍繞它自己座標系的對稱軸旋轉180°後拍攝得到的影象和未旋轉前得到的影象非常相似)。

然後,記該物體的對稱角度為α

\alpha

α,物體的旋轉角度為β

\beta

β,則只有限定物體的旋轉角度β∈[

0,α)

\beta \in [0, \alpha)

β∈[0,α

),物體的二維成像與物體的實際位姿才存在一一對應的關係,所以我們需要將訓練集中的標註位姿轉換到一定的範圍,使得在該範圍內拍攝得到的影象滿足上述一一對應的關係。實際上這裡只需要對訓練集中的標註位姿做簡單的3d幾何變換就可以了,下面講一下這個過程。

如上圖所示,假設物體的對稱角度為180°,則我們在固定的緯度拍攝物體製作資料集時,只需要在半個圓弧的範圍內拍攝即可,所以,如果假設原始標註的位姿不在這個半圓弧範圍內,我們就需要沿著該維度的圓形軌跡圍繞對稱軸反向旋轉β

−180

\beta -180

β−18

0°。這個過程只需經過下面的計算即可實現:

[ r′

∣t′]

=[r3

×3∣t

3×1]

[cos

(β%α

)−si

n(β%

α)00

sin(

β%α)

cos(

β%α)

0000

1000

01](1)

\left[ \begin r'&|&t' \end \right]= \left[ \begin r_&|&t_ \end \right] \left[ \begin cos(\beta\%\alpha)&-sin(\beta\%\alpha)&0&0\\ sin(\beta\%\alpha)&cos(\beta\%\alpha)&0&0\\ 0&0&1&0\\ 0&0&0&1 \end \right]\tag

[r′​∣​

t′​]

=[r3

×3​​

∣​t3

×1​​

]⎣⎢⎢

⎡​co

s(β%

α)si

n(β%

α)00

​−si

n(β%

α)co

s(β%

α)00

​001

0​00

01​⎦

⎥⎥⎤​

(1)上式中的%表示求餘數。

第三,通過觀察我們發現,即使物體經過旋轉之後(改變相機的位姿相對來說就是旋轉物體),當它的旋轉角度趨於區間[0,

α)[0, \alpha)

[0,α

) 0,

α/2)

[0, \alpha/2)

[0,α/2

)之間。這一步只需要識別出物體經過上一步處理得到的旋轉角度,如果位於[α/

2,α)

[\alpha/2,\alpha)

[α/2,α

)之間,則將該影象映象處理,輸入模型得到**的關鍵點後在映象回去。

最後,對於迴轉物體(也即對稱角度為0°),式(1)中直接反向旋轉β

\beta

β°。

點雲 相機位姿 什麼是物體6D位姿?

在一些有關物體6d位姿估計或者機械人抓取的 中,我們常會聽到乙個詞 物體6d位姿估計 6d object pose estimation 那什麼是物體的6d位姿呢?它和slam中的相機6d位姿一樣嗎?6d是指6個自由度,代表了3個自由度的位移 也叫平移 translation 以及3個自由度的空間旋...

如何理解物體的6D位姿估計任務?

如何 感性 地理解物體的6d姿態估計任務?答 三維世界中,比如我們開車行駛在道路上,我們不僅需要關注前方是否有車輛,而且更在意前方車輛的狀態,或者說姿態,是正在轉彎,還是正在駛向自己,或是遠離自己。其實這就是乙個物體的6d姿態估計任務。物體就是前方車輛,其在當前時刻,並在我方視角下,它的三維空間位置...

6DoF位姿估計之SSD 6D

4 評價 ssd 6d網路模型的演算法流程為 輸入一張299 times 299的彩色影象到backbone網路 inceptionv4 中,得到6個不同尺度的特徵圖 接著對於每乙個特徵圖,通過3 times 3的滑動視窗得到特徵圖上每個畫素點的分類和回歸結果,分類結果包括c cc種物體類別 取樣得...