深度學習與計算機視覺八

2021-10-24 06:39:06 字數 1911 閱讀 1053

1.滑窗法

思路很簡單,首先需要乙個已經訓練好的分類器,然後把影象按照一定間隔和不同的大小分成乙個個視窗,在這些視窗上執行分類器,如果得到較高的分類分數,就認為是檢測到了物體,把每個視窗都用分類器執行一遍之後,再對得到的分數做一些後處理的操作。

2.pascal voc .map和iou簡介

他是一套用於評估影象分類,檢測,分割和人體姿勢動作等的資料集。其中用的最多的就是物體檢測,包含4大類和20個細分類別,評價乙個檢測演算法,主要就是看兩個標準,也就是是否正確**了框內的物體類別:**的框和人工標註框的重合程度,他們的量化指標分別是map和iou,map也就是平均精度均值,他把每個類別的ap都單獨拎出來,然後計算所有類別ap的平均值,代表著對檢測到的目標平均精度的乙個綜合評價,iou是用來衡量**的物體框和真實框的重合程度。

3.selective search和r-cnn簡介

他的思路就是,可能存在物體的區域都應該是有某種相似性的或連續的區域,針對這兩個特點,採用超畫素合併的思路,首先用分割演算法再影象上產生很多的小區域,或者看做是超畫素,再根據這些區域之間的相似性進行區域合併,成為大一點的區域。

他的第乙個優點就是高效,因為不再是漫無目的的窮舉式搜尋,第二個優點就是由於採用了多樣的指標,提公升了找到物體的可靠性。

4.spp,roi pooling 和fast r-cnn簡介這個的思路就是,對整張執行一次卷積神經網路的前向計算,到了最後一層的啟用響應圖時,通過某種方式把目標物體所在區域部分的響應圖拿出來作為特徵給分類器。

5.yolo和ssd簡介

他能**多種:

1.物體框,包含物體框中心相對格仔中心的座標(x,y)和物體框的寬w和高h

2.每個物體框是否有物體的置信度,其中當前這個格仔如何包含物體,則置信度的分數為當前**的物體框和標註物體框的iou。

3.每個格仔**一共c個類別的概率分數,並且這個分數和物體框是不相關的,只是基於這個格仔。

yolo在速度上獲得了很大的提公升,但精度上比rcnn系還是遜色一些,其中乙個原因是基於格仔回歸物體框的方式在一定程度上限制了物體框位置和大小的靈活性。

而ssd算是同時借鑑了yolo和fr-cnn的思想,在達到實時的檢測速度水平下,保持很高的檢測精度,ssd也會在卷積神經網路的最後階段,保持很高的檢測精度。

1.距離和度量學習

在機器學習中,有一類演算法如k近鄰/k-means,svm,相似比對的演算法,非常依賴距離這個度量來對資料執行分類等任務,所以有乙個方向專門研究如何讓乙個演算法更好的學習到一種度量,比如歐式距離,提公升特定任務的演算法效能,這就是度量學習。

1.1歐式距離和馬式距離

1.2歐式距離和余弦距離

1.3非線性度量學習和siamese網路

很多代表性的度量學習的方法都是基於線性變換去做的,這個的優點就是學習出來的metric不容易過擬合,求解很快,但是缺點就是擬合能力往往不夠,對輸入樣本的特徵可分性要求也很高。

計算機視覺與深度學習公司

深度學習是大資料下最熱門的趨勢之一。上乙個十年是網際網路的時代,下乙個十年將是人工智慧的時代。國內已經產生大量的人工智慧公司,分布在不同的領域。2016年是人工智慧的元年,2017年將迎來 人工智慧 的春天。未來幾年也是人工智慧在金融 醫療 教育等大資料行業以及感知互動領域全面滲透的時期,我們正迎來...

深度學習與計算機視覺六

1.目標檢測演算法簡介 1.1滑窗法 滑窗法的思路及其簡單,需要乙個已經訓練好的分類器,然後把影象按照一定間隔和不同大小分成乙個個窗戶,在這些窗戶上執行分類器,如果得到較高的分類分數,就被認為是檢測到了物體,把每個視窗都用分類器執行一遍之後,再對得到的分數做一些後處理,比如非極大值抑制等,最後就得到...

計算機視覺 深度學習基礎

與神經網路的區別 傳統一般三層以內,深度可達上千層 傳統通常是全連線,深度形式多樣 共享權值,跨層的反饋等 目標函式 均方誤差 交叉熵 交叉熵能在深度學習模型下快速提高精度 為了避免交叉熵出現0,使用softmax層來突出最大值並轉換成概率 激勵函式 sigmoid relu 當神經元一層層疊加之後...