詳解HOG特徵描述運算元中的難點

2021-10-07 19:42:07 字數 1787 閱讀 1845

3.block中的拼接

梯度是在一副影象中尋找邊緣強度和方向的工具。梯度是用一階微分來實現的。先看下圖,梯度的表示。

梯度的大小是用如下公式表示的。

由於該公式下的計算會導致巨大的計算開銷,在多數情況下,是使用絕對值來近似平方和平方根的計算。該操作如下所示:

梯度的方向由以下公式表示:

需要注意的是,任意一點(x,y)處的乙個邊緣方向與該點處梯度向量的方向a(x,y)正交。如下圖所示:

從圖中我們可以看到,不管是灰度的突變區域,還是緩慢的過度區域,都能從一階微分中的數值中表現。符號表示亮與暗之間的過度方向。總結一句,一階微分的數值有無可以用來檢測某個點是否存在乙個邊緣處。hog就是利用了這個檢測邊緣特徵的性質來做相關的檢測。

首先我們需要做什麼預處理。一是灰度值的調節,二是降低雜訊。其中一,一般是由於拍攝環境或者攝影裝置使用不當,造成影象的過暴或者欠暴。

通過伽馬變換這種軟變換來彌補影象過暴或者欠暴的問題。

首先我們得明白導數對雜訊是極其敏感的,通過以下來說明:

其中第一列除了第一幅影象外,均新增了高斯雜訊。m表示均值,σ表示標準差。我們可以看到隨著雜訊的加大,邊緣特性在一階微分中的顯得越來越不明顯。邊緣一般是連續的,且波動不大的。但是在雜訊的干擾下,一階微分的結果波動加劇,最嚴重的情況下,可以說提取不到一點邊緣資訊。

可能都知道block在hog中的作用,1個block包括了多個cell,而且還會在影象中滑動囊括cell。通過block的歸一化處理,減少光照對影象過暴或欠暴的影響。

但是在cell形成block的過程中,本人將此過程想象成了簡單的拼接,如下圖所示

顯示不是這樣的,當然有相同的地方,那就是它們的幅值依舊是所在cell中得到的值,只需改動的是橫軸的座標。如下圖所示:

所以眾多的block可以形成一副的更多幅值的直方圖。如下圖標記處所示:

在形成hog的特徵描述子後,我們就可以得到中的眾多的特徵座標,如上圖標記處,就有4608個座標。然後將這些資料交給svm處理,分出多個超平面,不同的超平面對應著不同的特徵。

參考資料:

1.datawhale的計算機視覺基礎

2.岡薩雷斯,數字影象處理(第三版)

3.hog特徵詳解與行人檢測

Task04 HOG特徵描述運算元 行人檢測

本次任務將學習一種在深度學習之前非常流行的影象特徵提取技術 方向梯度直方圖 histogram of oriented gradients 簡稱hog特徵。hog特徵是在2005年cvpr的會議發表,在影象手工特徵提取方面具有里程碑式的意義,當時在行人檢測領域獲得了極大成功。學習hog特徵的思想也有...

CV Haar特徵描述運算元

1.3 案列 計算haar特徵值 1.4 特徵值歸一化 1.5 adaboost級聯分類器 2 python 實現 學習目標 haar特徵分為三類 邊緣特徵 線性特徵 中心特徵和對角線特徵,組合成特徵模板。特徵模板內有白色和黑色兩種矩形,並定義該模板的特徵值為白色矩形畫素和減去黑色矩形畫素和。haa...

HOG 目標檢測的特徵描述器之一

hog是 histogram of oriented gradient的縮寫,即方向梯度直方圖特徵,主要用於深度學習中的目標檢測與識別,是用來描述物體檢測的特徵描述子。最早由法國研究人員dalal在2005的cvpr上提出的,在該文中,作者利用hog與svm進行組合用來做行人檢測的任務,後來被廣泛應...