計算機視覺 七步帶你認識計算機視覺

2021-08-04 04:42:54 字數 2197 閱讀 7591

如果想要機器能夠進行思考,我們需要先教會它們去看。李飛飛——director of stanford ai lab and stanford vision lab

計算機視覺(computer vision)是一門研究如何使機器「看」的科學,更進一步的說,就是指用攝影機和計算機代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做影象處理,用計算機處理成更適合人眼觀察或進行儀器檢測的影象。

計算機從中生成數學模型計算機圖形在模型中對影象進行繪製,然後在影象處理過程中將其作為輸入,另外給出處理影象作為輸出

計算機視覺的理念在某些方面其實與很多概念有部分重疊,包括:人工智慧、數字影象處理、機器學習、深度學習、模式識別、概率圖模型、科學計算以及一系列的數學計算等。因此,你可以將本文看成是深入這個領域研究的第一步。本文將盡量包涵到盡可能多的內容,但是可能仍然會存在一些較為複雜的主題,也有可能存在某些遺漏之處,敬請見諒。

通常來說,你應該具有一點相關的學術背景,比如上過有關概率學、統計學、線性代數、微積分(微分與積分)等相關課程,對矩陣計算有一定了解更好。另外,從我的經驗來看如果你對數字訊號處理有了解的話,在以後對於概念的理解來說會更加容易。 

在實現層面來說,你最好能夠會用matlab或者python中的一種,一定要記住的是計算機視覺幾乎全部與計算機程式設計有關。 

你也可以在coursera上選修《概率繪圖模型》一課,這門課程相對較難(講得比較深入),你也可以在學習一段時間之後再對其進行了解。

**這些影片的同時,可以學習gatech的james hays教授的計算機視覺專案課程所使用的概念和演算法,這些練習也都是基於matlab的。千萬不要跳過這些練習,只有在真正的練習過程中才會對這些演算法和公式有更深入的了解。

如果你認真學習了前三步中的內容,現在可以進入到高階計算機視覺相關學習了。 

來自巴黎**理工學院的nikos paragios和pawan kumar講授了一門人工視覺中的離散推理(discrete inference in artificial vision)課程,它能提供相關的概率圖形模型和計算機視覺相關的大量數學知識。

到現在這一步來看就比較有趣了,這門課程一定能讓你感受到用簡單模型構築機器視覺系統有多麼複雜。學完這門課程的話,在接觸學術**之前又邁進一大步。

這一步我們要接觸到python程式語言。

就python而言有許多像 opencv、pil、vlfeat這樣的相關擴充套件包,現在就是將這些擴充套件包運用到你的專案中的最好時機。因為如果有其他的開源框架存在的話,沒有必要從頭開始來編寫一切內容。 

如果需要參考資料的話可以考慮《使用python對計算機視覺進行程式設計 programming computer vision with python》,使用這本書就夠了。你可以動手去嘗試下,看看matlab和python結合的話如何來實現你的演算法。

有關如何從頭開始機器學習的資料實在太多,你可以從在網上查詢到大量相關教程。

從現在開始最好一直使用python進行程式設計,可以看下《使用python建立機器學習系統——building machine learning systems with python》和《python機器學習——python machine learning》這兩本書。 

目前深度學習正大行其道,可以試著學習卷積神經網路在計算機視覺中的應用( computer vision: the use of covnets),在此推薦斯坦福的cs231n課程:針對視覺識別的卷積神經網路。 

行文至此,你可能會覺得已經講了太多的內容,需要學的已經太多。但是,你還可以進一步進行探索研究。 

其中乙個方法是看看由多倫多大學的sanja fidler和james hays所舉行的一系列研討會課程,能幫助你對當下計算機視覺研究方向的最新概念有所理解。 

另一種即跟著 cvpr、iccv、 eccv、 bmvc這些頂級學術會議的相關學術**(也可關注雷鋒網的相關報道),通過會上的研討會、主旨演講以及tutorial等日程一定能學到不少知識。 

總結

:如果你按照步驟一步步完成所有的學習任務,屆時你將大概了解計算機視覺中有關濾波器、特徵檢測、描述、相機模型、追蹤器的歷史,另外還學習到分割和識別、神經網路和深度學習的最新進展。希望本文能幫助你在計算機視覺領域走得更遠,學習得更加深入。

**:

七步帶你認識計算機視覺

如果想要機器能夠進行思考,我們需要先教會它們去看。李飛飛 director of stanford ai lab and stanford vision lab 計算機視覺 computer vision 是一門研究如何使機器 看 的科學,更進一步的說,就是指用攝影機和計算機代替人眼對目標進行識別 ...

(計算機視覺)計算機視覺基礎

opencv cximage cimg freeimage opencv中vc庫的版本與visual studio版本的對應關係 vc8 2005 vc9 2008 vc10 2010 vc11 2012 vc12 2013 vc14 2015 vc15 2017 visual studio中的輔助...

計算機視覺

主講老師 曹洋 課程 視覺 基礎 底 層處理 影象處理 特徵提 取 中 層處理 影象分割 相機標 定 深度 估計 運 動估計 高層處 理 3d 重建 目 標識別 視 覺基 礎 底層 處理 圖 像處理 特徵提取 中層 處理 圖 像分割 相機標定 深度估 計 運動 估計 高層處理 3d重 建 目標 識別...