深度學習與計算機視覺六

2021-10-23 22:35:01 字數 2041 閱讀 5078

1.目標檢測演算法簡介

1.1滑窗法

滑窗法的思路及其簡單,需要乙個已經訓練好的分類器,然後把影象按照一定間隔和不同大小分成乙個個窗戶,在這些窗戶上執行分類器,如果得到較高的分類分數,就被認為是檢測到了物體,把每個視窗都用分類器執行一遍之後,再對得到的分數做一些後處理,比如非極大值抑制等,最後就得到了物體類別和對應區域。

1.2pascal voc,map和iou簡介

pascal voc是一套用於評估影象分類,檢測,分割和人體姿勢動作等資料集,有4大類共20個細分類別。

從直觀上講,評價乙個檢測演算法的時候,主要看是否正確**了框內的物體類別:**的框和人工標註框的重合程度,量化指標是map和iou。

map中文翻譯過來叫做平均精度均值,其中ap的概念在第10章,map是把每個型別的ap都單獨「拎」出來,在計算所有類別ap的平均值,代表著對檢測到的目標平均精度的乙個綜合評價。

1.3selective search 和r_cnn簡介

selective search的思路就是,可能存在物體的區域都應該是某種相似性的或連續的區域,針對這兩個特點,乙個是使用超畫素合併的思路,首先用分割演算法在影象上產生很多小區域,或者看作是超畫素,在根據這些區域之間的相似性進行區域合併,成為大一點的區域。

1.4spp.roi pooling和 fast r_cnn

rpn首先是對基礎網路的最後一層卷積響應圖,執行一次卷積,輸出指定通道數的響應圖。這步相當於用滑窗法對響應圖進行特徵提取,然後對得到的響應圖的每個畫素分別進入到兩個全連線層,乙個計算該畫素對應位置是否有物體的分數,輸出是或者否的分數,然後另乙個是計算物體框的二維座標和大小,所以一共有四個輸出。

1.5yolo和ssd簡介

yolo的全稱是you only look once也就是只需要一眼就能感知出認識物體,他最大的特點就是,非常高效的檢測,他背後是yolo原理和實現上的簡單,他的基本思想就是把一副影象劃分為乙個ss的格仔,以每個格仔所在位置和對應內容為基礎。

ssd是同時借鑑了yolo和faster r-cnn思想的方法,可以在達到實時的檢測速度水平,仍然保持很高的檢測精度,和yolo相近的地方是,ssd也會在卷積神經網路的最後階段,最後得到ss的響應圖。

1mxnet的ssd實現

ssd中有些操作是預設不被mxnet支援的,這些操作定義在operator資料夾,所以我們需要做的是,找到根目錄下的make資料夾,開啟裡面的config.mk,找到extra_operators這一行,修改其中的路勁。

4.測試和評估模型效果

python evaluate.py

就會預設執行vgg16——reduced,epoch為0的模型在voc2007測試集上的評估,輸出每乙個類別ap和最後的map。

info:root:start evaluation with

4952 images,be patinet.

.writing aeroplane voc results file

..中間部分省略...

writing tvmonitor voc results file

voco7 metric? y

reading annotations for1/

4952..

.中間部分省略...

reading annotatios for

4901

/4952..

.ap for aeroplane =

0.7215..

.中間部分省略...

ap for tvmonitor =

0.6798

mean ap=

0.7158

而如果要評估別的模型的話,需要在指定輸入引數中寫下對應的python**,比如下面命令評估訓練完3個epoch得到的模型,並指定batch-size指定為24

python evaluate.py --batch-size 24 --epoch 3

計算機視覺與深度學習公司

深度學習是大資料下最熱門的趨勢之一。上乙個十年是網際網路的時代,下乙個十年將是人工智慧的時代。國內已經產生大量的人工智慧公司,分布在不同的領域。2016年是人工智慧的元年,2017年將迎來 人工智慧 的春天。未來幾年也是人工智慧在金融 醫療 教育等大資料行業以及感知互動領域全面滲透的時期,我們正迎來...

深度學習與計算機視覺八

1.滑窗法 思路很簡單,首先需要乙個已經訓練好的分類器,然後把影象按照一定間隔和不同的大小分成乙個個視窗,在這些視窗上執行分類器,如果得到較高的分類分數,就認為是檢測到了物體,把每個視窗都用分類器執行一遍之後,再對得到的分數做一些後處理的操作。2.pascal voc map和iou簡介 他是一套用...

計算機視覺(六)

影象檢索與相關應用 一。基於內容的影象檢索 分開展開 最近鄰問題 區域性敏感的雜湊 在高維空間和低維空間去保持距離 ann庫 串起來完成乙個cbir系統,進行分類。二。如何去讓我們的cbir系統更快?卷積神經網路進行找到影象的去處?影象檢索過程簡單說來就是對資料庫的每張抽取特徵 一般形式為特徵向量 ...