雙目立體視覺之深度估計

2021-08-19 09:30:10 字數 888 閱讀 7278

在此解答一下:首先,確實人通過乙隻眼也可以獲得一定的深度資訊,不過這背後其實有一些容易忽略的因素在起作用:一是因為人本身對所處的世界是非常了解的(先驗知識),因而對日常物品的大小是有乙個基本預判的(從小到大多年的視覺訓練),根據近大遠小的常識確實可以推斷出影象中什麼離我們遠什麼離我們近;二是人在單眼觀察物體的時候其實人眼是晃動的,相當於乙個移動的單目相機,這類似於運動恢復結構(structure from motion, sfm)的原理,移動的單目相機通過比較多幀差異確實可以得到深度資訊。

但是實際上,相機畢竟不是人眼,它只會傻傻的按照人的操作拍照,不會學習和思考。下圖從物理原理上展示了為什麼單目相機不能測量深度值而雙目可以的原因。我們看到紅色線條上三個不同遠近的黑色的點在下方相機上投影在同乙個位置,因此單目相機無法分辨成的像到底是遠的那個點還是近的那個點,但是它們在上方相機的投影卻位於三個不同位置,因此通過兩個相機的觀察可以確定到底是哪乙個點。

- 理想雙目相機成像模型

首先我們從理想的情況開始分析:假設左右兩個相機位於同一平面(光軸平行),且相機引數(如焦距f)一致。那麼深度值的推導原理和公式如下。公式只涉及到初中學的三角形相似知識,不難看懂。

根據上述推導,空間點p離相機的距離(深度)z=f*b/d,可以發現如果要計算深度z,必須要知道:

1、相機焦距f,左右相機基線b。這些引數可以通過先驗資訊或者相機標定得到。

2、視差d。需要知道左相機的每個畫素點(xl, yl)和右相機中對應點(xr, yr)的對應關係。這是雙目視覺的核心問題。

參考:

雙目立體視覺的發展

雙目立體視覺的發展 machinevision 雙目立體視覺是計算機視覺的乙個重要 分支,即由不同位置的兩台或者一台攝像機攝影測量學的傳統裝置標定法。利用至少17個引數描述 雙目立體視覺是計算機視覺的乙個重要分支,即由不同位置的兩台或者一台攝像機攝影測量學的傳統裝置標 定法。利用至少17個引數描述攝...

雙目估計方法 教你提高雙目立體視覺系統的精度!

雙目立體視覺 binocular stereo vision 是機器視覺的一種重要形式,它是基於視差原理並利用成像裝置從不同的位置獲取被測物體的兩幅影象,通過計算影象對應點間的位置偏差,來獲取物體三維幾何資訊的方法1。精度,是雙目立體視覺至關重要的指標。雙目立體視覺系統,不談精度幾許,未免顯得業餘!...

雙目立體視覺數學原理

雙目立體視覺技術的實現一般可分為 影象獲取 攝像機標定 特徵提取 影象匹配和三維重建幾個步驟。雙目立體視覺是基於視差原理,由三角法原理進行三維資訊的獲取,即由兩個攝像機的影象平面和北側物體之間構成乙個三角形。已知兩個攝像機之間的位置關係,便可以獲得兩攝像機公共視場內物體的三維尺寸及空間物體特徵點的三...