視覺跟蹤演算法 deeplearning

2021-06-20 02:51:58 字數 1099 閱讀 7237

視覺跟蹤,就是依據目標在第一幀的位置,對後續幀中目標的位置進行判定的過程。其主要困難是如何適應目標在運動過程中受內外部因素的影響而引起的外觀變化。主要分為生成模型方法和判別模型方法。所謂生成模型,就是依據歷史幀,生成模型,用以檢測當前幀中候選目標的重構誤差,重構誤差最小的即為跟蹤結果。判別模型,是將跟蹤視為二分類分別,當前區域是由背景及目標組成。通過在當前幀採集正負樣本,實現對分類器引數的更新。同時為了降低演算法的時間複雜度,可採取一些降維的、提取特徵的方法。

深度學習是針對神經網路的弊端由加拿大多倫多大學的hinton大牛提出來的,所謂的深度學習,也是相對於神經網路的淺層結構學習而言的。在深度學習中,基本的網路結構有rbm和自編碼。有許多的網路及其改進就是基於這兩種結構提出來的。其中rbm即受限波爾茲曼機,有兩層神經元網路結構。其中可見層由影象構成(28x28=784維),另外再加上乙個隱層。可見層與隱層各自中的單元相互無連線。兩層之間的任意節點之間均相連。

見層之間各個畫素點的分布即由隱層之間的相互關係來描述。

可以採用cd(對比散度)的方法來學習這個網路的權重及偏置等引數,學習時訓練資料量非常大。hinton在science上的發文稱,傳統神經網路的權值是隨機初始化的,而經過深度學習後,其權重比較接近最優的。

自編碼過程分為編碼和解碼兩部分。編碼部分對資料實現編碼,達到降維和特徵濃縮的目的,而解碼又將壓縮資訊還原為資料。所以,可將其想象為3層。有兩次連線。每次連線的權重和偏置是一樣的。在訓練結束之後,將隱層的解碼部分去掉,只保留編碼層。然後將原來的隱層當作可見層,再次實現編碼和解碼,重複以上過程,可得到堆疊式去噪自編碼。一般的來說隱層節點個數總比可見層少,正是這種"瓶頸"使得sdae能夠學習到魯棒的特徵。

深度學習***是由香港理工的naiyan wang提出來的,實現過程比較簡單。首先預訓練乙個堆疊式網路。在每一幀的跟蹤過程中,首先採集正負樣本,在已學習到的堆疊式網路上加上乙個分類層,利用bp神經網路進行微調,得到乙個分類網路。採集候選目標,則候選目標中得分最高的目標即為跟蹤結果。繼續在當前幀採集正負樣本,對其重新進行訓練。然後在下一幀收集候選目標,送入新的分類網路中。重複上述過程,即可實現跟蹤。整個跟蹤過程是由粒子濾波來引導的。

matlab視覺跟蹤演算法

視覺跟蹤技術研究發展到現在,形形色色的演算法不計其數,使人應接不暇。比較經典的演算法主要有meanshift,ivt,l1,mit,cv等。因為視覺跟蹤是乙個實驗性的問題,是各種機器學習演算法 計算機視覺知識在跟蹤領域中的綜合應用。因此,每個演算法在提出時,也需要給出演算法實現的 供大家檢驗。一般的...

TLD視覺跟蹤演算法

tld是一種演算法的簡稱,原作者把它叫做tracking learning detection。搞視覺的人看到這個名字都會嚇一跳,很ambitious的計畫。是09年的工作,不算太久,不過也不太新。網上關於這個的資源其實很多,很大程度和作者開放源 有關。學習過程中碰到的第乙個問題就是資源太多 當然是...

TLD視覺跟蹤演算法

本文 以下博文 tld是一種演算法的簡稱,原作者把它叫做tracking learning detection。搞視覺的人看到這個名字都會嚇一跳,很ambitious的計畫。是09年的工作,不算太久,不過也不太新。網上關於這個的資源其實很多,很大程度和作者開放源 有關。學習過程中碰到的第乙個問題就是...