計算機視覺跟蹤演算法 L1 tracker

l1 tracker的主要思想是用第一幀和最近幾幀得到的影象(特徵)作為字典，然後加上許許多多個trivial templates，也就是一幅影象中只有乙個白色畫素點，其他的都是黑色。這樣，將新得到的粒子濾波的candidate影象，利用l1最小二乘準則投影到這一組字典上。如果是前幾個template的係數比較大，那麼就說明可能是待跟蹤的目標，如果是有很多個trivial template的係數比較大，那麼說明可能是背景。

具體的：

1. 首先，本演算法也是乙個基於粒子濾波的演算法。在這其中加了乙個速度的變數，而速度則是之前的若干幀的目標速度的均值。

2. 粒子濾波得到目標的candidate之後，將所有的candidate向之前儲存的若干幀（template）以及一些人工構造的雜訊（trivial templates）進行l1約束的稀疏投影，如果得到的係數集中在前面幾個templates，那麼說明這個candidate和目標相似度高，如果後面的trivial templates的係數也很多，說明這個candidate和目標相似度低。

3. 具體的相似度計算是通過稀疏投影之後的殘差（也是一幅影象）來決定的。對於這幅殘差影象的每乙個畫素，建立乙個高斯模型（據說，可以證明，稀疏投影之後的殘差就是符合高斯分布的），均值為0，方差人工設定。那麼這個殘差影象越大，高斯模型得到的概率值就越小，說明這個candidate就越不可能是目標。這樣就量化了。

4. trivial templates的選取是這樣的：如果目標影象塊含有n個畫素，那麼就構造2n個trivial template，前n個trivial templates只有乙個畫素是+1，其他畫素全是0；後n個只有乙個畫素是-1，其他畫素全部是0。之所以要設計後n個trivial templates，是因為對於前面的幾個templates，由於正確的candidate應該和他們相像，所以他們的係數應該是正值（同時，這樣也能防止跟蹤到那種正好和目標畫素值相反的影象塊去），但是如果要求trivial templates的係數也都為正值，就無法解釋了。但是求解l1的時候，只限制一部分係數的正負是不好做到的，而限制全部係數的正負是容易做到的。因此，這裡就採取了又構造n個和前n個trivial template正負號相反的模板，這樣，就可以通過限定全部係數為正數來近似實現前面所說的理論了。

5. 模板更新：

a. 維持乙個模板集t，裡面的每乙個模板都對應乙個權重w

b. 由於l1的優化表示式的關係，模板的長度（||*||2)越大，這個模板就越重要，因此可以將模板的長度當做其自然權重v

c. 對於每次l1求出的係數a，係數越大的模板越重要，因此上述自然權重需要乘以exp(a)得到最終的權重w

d. 考察本幀跟蹤得到的結果y和l1係數最大的模板的相似度（用向量的cos度量），如果該相似度小於某一值，那麼就替換掉最終權重最小的那個模板，用本幀跟蹤到的目標代替，權重使用所有權重的均值。

e. 更新完成過後，歸一化權重，使的所有權重的平方和為1

f. 再調整權重的值，使其最大值不超過0.3，以免模板退化（有乙個模板的權重值特別大）

g. 歸一化模板t，使t的長度（2階矩）等於其現在的權重。

計算機視覺跟蹤演算法 L1 tracker

計算機視覺基礎之質心跟蹤演算法1

計算機視覺演算法

計算機視覺CV 之 CMT跟蹤演算法分析二

計算機視覺跟蹤演算法 L1 tracker

計算機視覺基礎之質心跟蹤演算法1

計算機視覺演算法

計算機視覺CV 之 CMT跟蹤演算法分析二

相關推薦