SLAM從入門到放棄幾何資訊深度學習

深度學習和幾何結構的結合，將極大提高現有演算法的效能。

幾何描述了物理世界的結構、形狀、體積、深度、姿態、視差、運動、光流等資訊。

語義表達利用語言來描述現實世界裡的關聯。比如，貓或者狗都是對某種物體的語言描述。語義有關的研究在計算機視覺領域廣受關注，許多高引用率的突破性的文章都和影象分類和語義分割有關。

posenet是乙個單目6個自由度的重定位演算法，能夠從單張估計相機的6個自由度。

iccv 2015上，**《posenet: a convolutional network for real-time 6-dof camera relocalization》使用乙個卷積神經網路來學習輸入影象到6自由度相機姿態的端到端的對映，這僅僅是簡單地將該問題視為乙個黑盒問題。cvpr 2017的**《geometric loss functions for camera pose regression with deep learning》使用幾何重投影誤差來同時對相機位置和方向進行學習，利用真實世界幾何資訊極大地提高了效能。

專案主頁：

開源**：

雙目視覺演算法用2個相機拍攝同一物體的視差來估計深度。該問題可以簡化為乙個匹配問題——也就是尋找同乙個物體在左右兩個相機拍攝裡的對應點。

目前該領域最好的演算法是基於深度學習的方法來學習用於匹配的特徵，而估計深度所必須的匹配和正則化部分大部分仍然是非學習的方法。而cvpr17**《end-to-end learning of geometry and context for deep stereo regression》提出了gc-net (geometry and context network)，網路結構如下所示。

此**將該問題視為基礎幾何的問題。該**的創新之處就是用微分方式建立幾何代價體用於回歸模型。

SLAM從入門到放棄幾何資訊深度學習

SLAM從入門到放棄 SLAM十四講第一章習題

kmp從入門到放棄

beego 從入門到放棄

SLAM從入門到放棄 幾何資訊 深度學習

SLAM從入門到放棄 SLAM十四講第一章習題

kmp從入門到放棄

beego 從入門到放棄

相關推薦

SLAM從入門到放棄幾何資訊深度學習