HOG 目標檢測的特徵描述器之一

2021-08-04 17:40:52 字數 1148 閱讀 5915

hog是

histogram of oriented gradient的縮寫,即方向梯度直方圖特徵,主要用於深度學習中的目標檢測與識別,是用來描述物體檢測的特徵描述子。最早由法國研究人員dalal在2005的cvpr上提出的,在該文中,作者利用hog與svm進行組合用來做行人檢測的任務,後來被廣泛應用。

首先說一說hog代表的什麼資訊吧,我們所研究的影象中區域性目標的表象和形狀能夠通過(梯度或邊緣的方向密度分布)很好的表達,說白了就是影象的梯度資訊,一般來說,梯度主要存在於邊緣的地方。

接下來就是怎麼獲取方向梯度了,首先說的是大致的方向,我們把區域性影象分成若干個小區域(細胞單元),然後統計各個區域中各個畫素的梯度或邊緣的方向直方圖,最後將梯度資訊統計在一起就是我們的特徵描述器了。

接下來就是怎樣將多個區域性影象連成更大範圍(我們習慣稱block)的影象特徵,那麼我們如果想要把更大範圍的影象統一梯度方向直方圖,那麼我們首先需要將他們進行歸一化,我們前面提到的細胞單元應該就是我們統一歸一化的物件,那麼歸一化的尺度就應該是通過計算各個區域性影象在總影象(block)的密度,然後根據這個密度在對各個區域性影象的細胞單元進行歸一化,這樣以來,實驗表明能減少光照變化和陰影對影象特徵的影響。

hog主要是用來進行行人檢測的特徵描述方法,一般來說該方法對影象的幾何形變以及光照的變化都能保持不敏感性,在hog的條件下,我們能檢測出肢體進行輕微動作的直立行人,是目前比較流行的行人檢測的特徵描述方法。

首先我們通過視窗獲得乙個檢測目標我們稱之image:

1)灰度化(將影象轉化為單通道);

2)對影象驚醒顏色空間的標準化,來調節圖想的對比度,降低影象降低影象區域性的陰影和光照變化所造成的影響,同時可以抑制噪音的干擾;

3)計算影象每個畫素的梯度(包括大小和方向);梯度大的地方一定處在邊緣,影象比較平滑的地方梯度較小,所以我們能夠很好的描述出邊界輪廓。

4)將區域性影象分成若干小的連通區域(細胞單元)統計他們的梯度資訊得到每個細胞單元的直方圖,將多個區域性影象連成block,將乙個block內部所有的細胞單元歸一化組成該block的特徵描述器。

5)將影象內所有的block的hog特徵描述器連到一起得到該目標的整體hog特徵,即最後我們需要的特徵向量。

其實說了這麼多我們應該對hog有了大致的了解,對於初學者來說我們能夠會用,並且知道他所描述的特徵應該就差不多了,具體的內部原理有興趣的同學可以再查有關資料。

Task04 HOG特徵描述運算元 行人檢測

本次任務將學習一種在深度學習之前非常流行的影象特徵提取技術 方向梯度直方圖 histogram of oriented gradients 簡稱hog特徵。hog特徵是在2005年cvpr的會議發表,在影象手工特徵提取方面具有里程碑式的意義,當時在行人檢測領域獲得了極大成功。學習hog特徵的思想也有...

詳解HOG特徵描述運算元中的難點

3.block中的拼接 梯度是在一副影象中尋找邊緣強度和方向的工具。梯度是用一階微分來實現的。先看下圖,梯度的表示。梯度的大小是用如下公式表示的。由於該公式下的計算會導致巨大的計算開銷,在多數情況下,是使用絕對值來近似平方和平方根的計算。該操作如下所示 梯度的方向由以下公式表示 需要注意的是,任意一...

特徵檢測之HOG

參考 原始碼解讀 下面給出opencv的hog特徵提取 hogdescriptor類可以完成hog的特徵提取過程,建構函式 hogdescriptor size win size size 64,128 size block size size 16,16 size block stride siz...