計算機視覺之目標識別學習筆記

2021-10-13 15:21:06 字數 633 閱讀 2830

影象分類:判斷輸入的影象中是否包含感興趣的內容

目標檢測:精確定位目標的具體位置,並用外接矩形框標出(就是很高階的那種)

神經網路可以用來**各種各樣的實際問題,但是cnn不擅長直接**座標資訊,考慮到一張影象中可能出現多個檢測的目標,模型就比較難搞。所以,就順理成章提出了一種通過猜測的方法來判斷猜測的框中是否存在待檢測目標的方法。就是通過滑窗的方式,羅列圖中各種可能的區域,乙個個去試,分別送入到分類網路進行分類得到其類別,同時會對當前的邊界框進行微調,這樣對於影象中每個區域都能得到(class,x1,y1,x2,y2)五個屬性,彙總後最終就得到了圖中物體的類別和座標資訊。

這種方案思路:先確立眾多候選框,再對候選框進行分類和微調。

也就是在待識別圖上預設乙個框,然後逐畫素遍歷,就能得到大量候選框,每個框送入到如cnn的分類網路分類都有乙個得分,得分最高的就代表識別的最準確的框,其位置就是最終要檢測的目標的位置。

第一種(x1, y1, x2, y2) ,其中x1 y1表示左上角的那個點,x2 y2表示右下角的那個點

第二種(c_x, c_y, w, h),其中c_x為中心點x座標,c_y為中心點的y座標,w為寬度,h為長度

這兩種方法完全可以互換,在openmv中就存在呼叫庫函式出現不同返回值的情況。

計算機視覺 1 學習筆記

datawhale cv入門訓練 原始json標註 讀取資料 train json json.load open mypath cv dataset mchar train.json 資料標註處理 每張中有乙個或者多個數字 defparse json d arr np.array d top d h...

計算機視覺 opencv人臉識別

import cv2 步驟1 載入影象 gray cv2.cvtcolor img cv2.color bgr2gray 將影象轉換成灰度模式 opencv載入影象的方式是bgr cv2.imshow test gray cv2.waitkey 0 為什麼不直接在載入影象的時候指定灰度影象?而是要轉...

筆記 計算機視覺筆記

計算機視覺是一門研究如何使機器 看 的科學,更進一步的說,就是指用攝影機和計算機代替人眼對目標進行識別 跟蹤和測量等機器視覺,並進一步做影象處理,用計算機處理成為更適合人眼觀察或傳送給儀器檢測的影象 選自維基百科 計算機視覺的研究物件主要是對映到單幅或多幅影象上的三維場景,例如三維場景的重建。計算機...