視覺跟蹤演算法 deeplearning

視覺跟蹤，就是依據目標在第一幀的位置，對後續幀中目標的位置進行判定的過程。其主要困難是如何適應目標在運動過程中受內外部因素的影響而引起的外觀變化。主要分為生成模型方法和判別模型方法。所謂生成模型，就是依據歷史幀，生成模型，用以檢測當前幀中候選目標的重構誤差，重構誤差最小的即為跟蹤結果。判別模型，是將跟蹤視為二分類分別，當前區域是由背景及目標組成。通過在當前幀採集正負樣本，實現對分類器引數的更新。同時為了降低演算法的時間複雜度，可採取一些降維的、提取特徵的方法。

深度學習是針對神經網路的弊端由加拿大多倫多大學的hinton大牛提出來的，所謂的深度學習，也是相對於神經網路的淺層結構學習而言的。在深度學習中，基本的網路結構有rbm和自編碼。有許多的網路及其改進就是基於這兩種結構提出來的。其中rbm即受限波爾茲曼機，有兩層神經元網路結構。其中可見層由影象構成(28x28=784維)，另外再加上乙個隱層。可見層與隱層各自中的單元相互無連線。兩層之間的任意節點之間均相連。

見層之間各個畫素點的分布即由隱層之間的相互關係來描述。

可以採用cd(對比散度)的方法來學習這個網路的權重及偏置等引數，學習時訓練資料量非常大。hinton在science上的發文稱，傳統神經網路的權值是隨機初始化的，而經過深度學習後，其權重比較接近最優的。

自編碼過程分為編碼和解碼兩部分。編碼部分對資料實現編碼，達到降維和特徵濃縮的目的，而解碼又將壓縮資訊還原為資料。所以，可將其想象為3層。有兩次連線。每次連線的權重和偏置是一樣的。在訓練結束之後，將隱層的解碼部分去掉，只保留編碼層。然後將原來的隱層當作可見層，再次實現編碼和解碼，重複以上過程，可得到堆疊式去噪自編碼。一般的來說隱層節點個數總比可見層少，正是這種"瓶頸"使得sdae能夠學習到魯棒的特徵。

深度學習***是由香港理工的naiyan wang提出來的，實現過程比較簡單。首先預訓練乙個堆疊式網路。在每一幀的跟蹤過程中，首先採集正負樣本，在已學習到的堆疊式網路上加上乙個分類層，利用bp神經網路進行微調，得到乙個分類網路。採集候選目標，則候選目標中得分最高的目標即為跟蹤結果。繼續在當前幀採集正負樣本，對其重新進行訓練。然後在下一幀收集候選目標，送入新的分類網路中。重複上述過程，即可實現跟蹤。整個跟蹤過程是由粒子濾波來引導的。

視覺跟蹤演算法 deeplearning

matlab視覺跟蹤演算法

TLD視覺跟蹤演算法

TLD視覺跟蹤演算法

視覺跟蹤演算法 deeplearning

matlab視覺跟蹤演算法

TLD視覺跟蹤演算法

TLD視覺跟蹤演算法

相關推薦