關於kinect的一些想法

2022-04-04 09:29:03 字數 919 閱讀 8530

截至目前,最精確可行的光學測距方法可能就是tof(time of flight),例如ldm雷射測距、idm紅外測距等等具體技術已經實現了產品化;另一方面,如今許多三維掃瞄器都採用了三角測距法,特別是對手持式掃瞄裝置而言。然而上述這些技術都不太適用於kinect這種家用裝置:首先是測量環境的限制,其次還要考慮成本因素。

primesense的測距技術類似一部分結構光技術,「結構光」指一些具有特定模式的光,其pattern的圖案可以是線、點、麵等多種圖形。結構光掃瞄法的原理是首先將結構光投射至物體表面,再使用攝像機接收該物體表面反射的結構光圖案,由於接收圖案必會因物體的立體形狀而發生變形,那麼就可以試圖通過該圖案在攝像機上的位置和形變程度來計算物體表面的空間資訊。普通的結構光方法仍然是部分採用了三角測距原理進行深度計算。

primesense將其深度測量技術命名為light coding,與結構光法不同的是,light coding的光源被稱為「雷射散斑(laser speckle)」,是當雷射照射到粗糙物體或穿透毛玻璃後形成的隨機衍射斑點。這些散斑具有高度的隨機性,而且會隨著距離的不同變換圖案。也就是說空間中任意兩處的散斑圖案都是不同的。只要在空間中打上這樣的結構光,整個空間就都被做了標記,把乙個物體放進這個空間,只要看看物體上面的散斑圖案,就可以知道這個物體在什麼位置了。

當然,在這之前要把整個空間的散斑圖案都記錄下來,所以要先做一次光源的標定。在primesense的專利上,標定的方法是這樣的:每隔一段距離,取乙個參考平面,把參考平面上的散斑圖案記錄下來。假設natal規定的使用者活動空間是距離電視機1公尺到4公尺的範圍,每隔10cm取乙個參考平面,那麼標定下來我們就已經儲存了30幅散斑影象。需要進行測量的時候,拍攝一副待測場景的散斑影象,將這幅影象和我們儲存下來的30幅參考影象依次做互相關運算,這樣我們會得到30幅相關度影象,而空間中有物體存在的位置,在相關度影象上就會顯示出峰值。把這些峰值一層層疊在一起,再經過一些插值,就會得到整個場景的三維形狀了。

關於OCR,一些想法

ocr一般分為兩種 1,根據給定的字元特徵集合,提取未知字元的特徵進行匹配識別 典型例子 gocr 2,不知道字元特徵,但給出提取特徵的規則,通過機器學習training來獲取某個字符集的特徵集,對未知字元進行匹配識別。典型例子 tesseract 第一種方法簡單,在某些場合很高效,但比較侷限,字符...

關於tv app的一些想法

以前是做iptv機頂盒的,現在是做網際網路電視機頂盒的,在技術上的區別是不大的。通過這些年與電信,廣電打交道,現在對產品有了一些小想法。那麼在顯示上都是以web為主,用web來顯示epg內容,用osd來顯示狀態。但是隨著android的出現,現在大部分機頂盒或電視劇集廠家,都開始了智慧型之旅。乙個是...

關於敏捷的一些想法

敏捷軟體開發宣言 個體和互動 勝過 過程和工具 可以工作的軟體 勝過 面面俱到的文件 客戶合作 勝過 合同談判 響應變化 勝過遵循計畫 今天看了robert martin的ppp一書的第一部分,敏捷開發 回顧了自己曾經加盟過的幾個公司,經歷過的大大小小的專案,感慨良多。這些公司中不乏奉過程開發為寶典...