關於手指提取的文章的調研

2021-09-30 11:33:13 字數 1201 閱讀 3555

這篇文章提取手指    可以認為分為三步

a.首先是應用顏色直方圖求影象各畫素的saliency 顯著性

並且對顯著性本身進行了乙個均值濾波  

得到了乙個增強後的影象 即saliency map

我們的前景變得更加突出   更適合於之後進行聚類等的提取

b.然後是進行基於meanshift演算法 均值偏移的乙個聚類 

所謂的meanshift演算法是乙個迭代過程  這可以套用已有的**

結果是得到了l個區域  該方法乙個特點是濾掉投影圖案的前提下能夠保護手指邊緣的資訊(boundary)

c.最後通過乙個confidence function 求出每個區域屬於手指的概率  當概率大於一定閾值時認為屬於手指區域

最終得到了提取出的精細的手指  如d所示

那麼該方法有什麼特點  能夠應用在哪些情形下呢????

首先對於saliency那一步我覺得很有用,能夠突出我們想要的資訊。當然比單純使用ycbcr顏色空間中的cr通道資訊效果要好。該方法突出是是前景與背景之間顏色的差異性,而與前景本身是什麼顏色關係不大,所以即使是黑人的手指也能很好的使用。

然後meanshift演算法是個比較經典的聚類方法。與區域生長演算法等方法相比,雖然仍然需要迭代,但是在提取saliency map後之後迭代次數能降不少,所以時間複雜度上不用過度擔心。關鍵是不需要提取質心,所以不需要對手指進行粗提取來找質心,也排除了質心尋找錯誤的問題。

最後confidence function的方法,衡量每個區域是否屬於手指確實是比較好的方法。以往比較簡單的手指提取往往在標記連通區域之後直接提取最大的連通域,並且認為這樣就去除了干擾的影響。但實際上有時可能有些小的連通域也是屬於手指的,只不過由於各種干擾所以被分割開了。

接下來需要對每步的實現細節進一步了解。

需要參考:

1.global contrast based salient region detection     利用顯著性進行影象分割以及得到顯著圖的細節

3.hand gesture recognition in camera-projector system  參考這篇文章裡radiometry 標定的部分

關於進製的文章

計算機的數制與編碼 來說一下進製計數制 十進位制 dec 逢十進一 加法規則 借一當十用 減法規則 二進位制 bin 逢二進一 借一當二用 八進位制 oct 逢八進一 借一當八用 十六進製制 hex 逢十六進一 借一當十六用 上面就一系列進製轉換的運算規則 每乙個進製都有乙個基數 十進位制 0 9 ...

關於奇異掃雷的需求調研

作業 每個小組做 一次需求調研,要求如下 選一種合適的需求調研方法 為你的小組找到乙個目標使用者 到教室外找到別的班級的同學 如果目前已經有原型系統,讓她 他使用軟體解決真實的問題 觀察,記錄 如果沒有原型可以展示的小組可以採取 調查問卷 深入採訪 的辦法 總結使用者反饋 錄影,把錄影上傳至團隊部落...

TF IDF演算法提取文章的關鍵詞

初學中文文字分詞,從最簡單的tf idf演算法入手,理解其中的邏輯結構,其中使用jieba分詞包作為分詞模型。這裡部分內容參考了 hahaha的部落格。tf idf原理 舉個例子 我們在大學選修了數學和體育兩門課,數學為9學分,體育為1學分,期末的時候考試成績分別為60和100分,那麼如果我們說平均...