關於計算機視覺的識別與檢索問題的思考

2021-09-24 20:10:02 字數 955 閱讀 9160

計算機視覺所有的識別與檢索問題,目標追蹤問題,行人檢測問題,行人重識別問題,移動機械人目標跟隨問題,都是想法設法找出跟隨目標的不變數出來。有了不變數,才有談論後續工作的可能性。

假如人都無法從影象中識別出目標,那麼讓計算機找出來也就無從談起。

假如是乙個數學問題,需要求解,我們的思路是,先證明問題有解,再求解。

問題有解是求解的必要條件。

只有問題有解,我們求解才是有意義的。否則就是徒勞的,求解乙個沒有解的問題,就像希臘神話裡,每天推著石頭到山上的西西福斯,石頭快到頂就會滾下來,周而復始。

學生時代,數學課本經常出現證明題,一般都是存在性證明。

脫離了別人提問、我們解答的學生時代,進入真正解決問題的時候,我們很多人就忘記了關注乙個問題的有解性。

但是這一部分展開的討論很少。我們在計算機視覺方面的工作更像是鬍子眉毛一把抓,任何物件拿來就求解。之後花大力氣提高識別率。

識別問題是區域性有解的問題。不同的識別物件,有解的條件不一樣。控制領域關心乙個解是否魯棒,意思是就算條件苛刻,解依然存在。這個概念也可以用在計算機視覺識別領域。識別是否魯棒?

人臉的特徵隨時間變化緩慢,人臉識別是魯棒的。人體重識別就不魯棒,因為被識別物件變化因素太多。能夠唯一確定乙個人的,幾乎只能是dna比對。僅僅靠視覺來重識別乙個人,條件是很苛刻的,數學上會說這是乙個很強的條件。被識別物件的變數越多,識別越不魯棒,變化到一定程度,已經沒有重識別的意義,比如光線差異巨大,視角差異巨大,服飾變化巨大,視覺上的視覺已經失去意義。

生物從出現感光細胞,到進化出眼球、視覺,用視覺處理環境,絕不僅僅是輸入畫素,對畫素的各種處理。轉到計算機視覺,就只剩下對畫素的處理。我認為識別領域的泡沫太多,現在的計算機視覺處理問題的方式,本質上都是尋找畫素之間關係,再數學一點說,都是尋找二維矩陣中數字關係,最後想要實現眼睛和大腦對問題處理的效果。

我們應該謹慎對待生物意義上和計算機軟硬體層面上的輸入層差異,這一差異是否遺漏了重要資訊?假如遺漏了重要資訊,我們想要的效果就達不到了。

計算機視覺 人臉檢測與識別

長文乾貨!走近人臉檢測 從 vj 到深度學習 上 長文乾貨!走近人臉檢測 從vj到深度學習 下 caffe實踐 基於caffe的人臉檢測實現 人臉檢測 ddfd 人臉檢測 cascadecnn cascadecnn人臉檢測學習筆記 python批量預處理 cascadecnn訓練前期預處理 casc...

計算機視覺 opencv人臉識別

import cv2 步驟1 載入影象 gray cv2.cvtcolor img cv2.color bgr2gray 將影象轉換成灰度模式 opencv載入影象的方式是bgr cv2.imshow test gray cv2.waitkey 0 為什麼不直接在載入影象的時候指定灰度影象?而是要轉...

計算機視覺識別技術研究

計算機視覺識別概述 計算機視覺識別 computer vision 用計算機來模擬人的視覺機理獲取和處理資訊的能力。就是指用攝影機和電腦代替人眼對目標進行識別 跟蹤和測量等機器視覺,並進一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的影象。這裡給出了幾個比較嚴謹的定義 1.對影象中的客...