計算機視覺識別技術研究

2021-10-16 09:10:35 字數 2066 閱讀 5623

計算機視覺識別概述

計算機視覺識別(computer vision):用計算機來模擬人的視覺機理獲取和處理資訊的能力。就是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的影象。這裡給出了幾個比較嚴謹的定義:1.「對影象中的客觀物件構建明確而有意義的描述」(ballard&brown,1982)2.「從乙個或多個數字影象中計算三維世界的特性」(trucco&verri,1998)3.「基於感知影象做出對客觀物件和場景有用的決策」(sockman&shapiro,2001)。

計算機視覺識別實際上是乙個跨領域的交叉學科,包括電腦科學(圖形、演算法、理論、系統、體系結構),數學(資訊檢索、機器學習),工程學(機械人、語音、自然語言處理、影象處理),物理學(光學 ),生物學(神經科學)和心理學(認知科學)等等。計算機視覺研究相關的理論和技術,試圖建立能夠從影象或者多維資料中獲取『資訊』的人工智慧系統。計算機視覺的挑戰是要為計算機和機械人開發具有與人類水平相當的視覺能力。

計算機視覺識別主要流程

計算機視覺的目標是從攝像機得到的二維影象中提取三維資訊,從而重建三維世界模型。在這個過程中,獲得場景中某一物體的深度,即場景中物體各點相對於攝像機的距離,無疑成為了計算機視覺的研究重點。獲得深度圖的方法可分為被動測距和主動測距。被動測距是指視覺系統接受來自場景發射或反射的光能量,形成有關場景的二維影象,然後在這些二維影象的基礎上恢復場景的深度資訊。具體實現方法可以使用兩個或多個相隔一定距離的照相機同時獲取場景影象,也可使用一台照相機在不同空間位置上分別獲取兩幅或兩幅以上的影象。主動測距與被動測距的主要區別在於視覺系統是否是通過增收自身發射的能量來測距,雷達測距系統、雷射測距系統則屬於主動測距。主動測距的系統投資巨大,成本太高,而被動測距方法簡單,並且容易實施,從而得到了廣泛的應用。利用被動測距的計算機視覺主要分為四個步驟,如圖所示。

影象獲取。

一般情況下,人類通過雙眼來獲得影象,雙眼可近似為平行排列,在觀察同一場景時,左眼獲得左邊的場景資訊多一些,在左視網膜中的影象偏右;而右眼獲得右邊場景資訊多一些,在右視網膜中的影象偏左。同一場景點在左視網膜上和右視網膜上的影象點位置差異即為視差,也是感知物體深度的重要資訊。

計算機視覺的獲取影象的原理與人眼相似,是通過不同位置上的相機來獲得不同的影象,左攝像機拍攝的影象稱為左影象,右攝像機拍攝的影象稱為右影象。左影象得到左邊的場景資訊多一些,右影象得到右邊場景的資訊多一些,

影象校準。

在影象獲取過程中,有許多因素會導致影象失真,如成像系統的象差、畸變、頻寬有限等造成的影象失真;由於成像器件拍攝姿態和掃瞄非線性引起的影象幾何失真;由於運動模糊、輻射失真、引入雜訊等造成的影象失真。

立體匹配。

在兩幅或多幅不同位置下拍攝的且對應同一場景的影象中,建立匹配基元之間關係的過程稱為立體匹配。例如,在雙目立體匹配中,匹配基元選擇畫素,然後獲得對應於同乙個場景的兩個影象中兩個匹配畫素的位置差別,即視差。並將視差按比例轉換到0-255 之間,以灰度圖的形式顯示出來,即為視差圖。

三維重建

根據立體匹配得到的畫素的視差,如果已知照相機的內外引數,則根據攝像機幾何關係得到得到場景中物體的深度資訊,進而得到場景中物體的三維座標。

計算機識別傳統組成

計算機視覺系統的開發問題歸納為3個要素:

(1)數學理論

考慮數學計算層面的目標及可以引入的合理約束條件。

(2)描述和演算法

重點解決計算機視覺中的輸入輸出的資料格式問題,並設計合理的演算法實現其系統功能。

(3)硬體的合理使用

使用符合演算法要求的硬體並考慮該硬體對所需要的演算法和描述的反作用。

影象資料處理層

對影象畫素或者頻域進行相應處理,比如影象獲取、傳輸、壓縮、降噪、裝換、儲存、增強和復原等。

影象識別獲取層

影象識別是指利用計算機對影象進行處理、分析和理解,以識別不同模式的目標和物件的技術,主要包括影象匹配和機器學習。影象匹配的研究內容大致集中在三個方面:特徵空間;相似性度量;搜尋策略

計算機視覺 opencv人臉識別

import cv2 步驟1 載入影象 gray cv2.cvtcolor img cv2.color bgr2gray 將影象轉換成灰度模式 opencv載入影象的方式是bgr cv2.imshow test gray cv2.waitkey 0 為什麼不直接在載入影象的時候指定灰度影象?而是要轉...

(計算機視覺)計算機視覺基礎

opencv cximage cimg freeimage opencv中vc庫的版本與visual studio版本的對應關係 vc8 2005 vc9 2008 vc10 2010 vc11 2012 vc12 2013 vc14 2015 vc15 2017 visual studio中的輔助...

計算機視覺 全息投影技術

標籤 空格分隔 影象處理 科普雜談 說明 本文主要想弄清楚全息投影技術的一些科普知識,基於前天diy了乙個小型簡易的projector,現在對其原理進行說明一下。全息投影技術也稱虛擬成像技術是利用干涉和衍射原理記錄並再現物體真實的三維影象的記錄和再現的技術。實際上全息技術在我們的日常生活中已經被廣泛...