計算機視覺跟蹤演算法 L1 tracker

2021-06-21 15:32:23 字數 1516 閱讀 7095

l1 tracker的主要思想是用第一幀和最近幾幀得到的影象(特徵)作為字典,然後加上許許多多個trivial templates,也就是一幅影象中只有乙個白色畫素點,其他的都是黑色。這樣,將新得到的粒子濾波的candidate影象,利用l1最小二乘準則投影到這一組字典上。如果是前幾個template的係數比較大,那麼就說明可能是待跟蹤的目標,如果是有很多個trivial template的係數比較大,那麼說明可能是背景。

具體的:

1.   首先,本演算法也是乙個基於粒子濾波的演算法。在這其中加了乙個速度的變數,而速度則是之前的若干幀的目標速度的均值。

2.   粒子濾波得到目標的candidate之後,將所有的candidate向之前儲存的若干幀(template)以及一些人工構造的雜訊(trivial templates)進行l1約束的稀疏投影,如果得到的係數集中在前面幾個templates,那麼說明這個candidate和目標相似度高,如果後面的trivial templates的係數也很多,說明這個candidate和目標相似度低。

3.   具體的相似度計算是通過稀疏投影之後的殘差(也是一幅影象)來決定的。對於這幅殘差影象的每乙個畫素,建立乙個高斯模型(據說,可以證明,稀疏投影之後的殘差就是符合高斯分布的),均值為0,方差人工設定。那麼這個殘差影象越大,高斯模型得到的概率值就越小,說明這個candidate就越不可能是目標。這樣就量化了。

4.   trivial templates的選取是這樣的:如果目標影象塊含有n個畫素,那麼就構造2n個trivial template,前n個trivial templates只有乙個畫素是+1,其他畫素全是0;後n個只有乙個畫素是-1,其他畫素全部是0。之所以要設計後n個trivial templates,是因為對於前面的幾個templates,由於正確的candidate應該和他們相像,所以他們的係數應該是正值(同時,這樣也能防止跟蹤到那種正好和目標畫素值相反的影象塊去),但是如果要求trivial templates的係數也都為正值,就無法解釋了。但是求解l1的時候,只限制一部分係數的正負是不好做到的,而限制全部係數的正負是容易做到的。因此,這裡就採取了又構造n個和前n個trivial template正負號相反的模板,這樣,就可以通過限定全部係數為正數來近似實現前面所說的理論了。

5.   模板更新:

a.    維持乙個模板集t,裡面的每乙個模板都對應乙個權重w

b.   由於l1的優化表示式的關係,模板的長度(||*||2)越大,這個模板就越重要,因此可以將模板的長度當做其自然權重v

c.    對於每次l1求出的係數a,係數越大的模板越重要,因此上述自然權重需要乘以exp(a)得到最終的權重w

d.   考察本幀跟蹤得到的結果y和l1係數最大的模板的相似度(用向量的cos度量),如果該相似度小於某一值,那麼就替換掉最終權重最小的那個模板,用本幀跟蹤到的目標代替,權重使用所有權重的均值。

e.   更新完成過後,歸一化權重,使的所有權重的平方和為1

f.     再調整權重的值,使其最大值不超過0.3,以免模板退化(有乙個模板的權重值特別大)

g.   歸一化模板t,使t的長度(2階矩)等於其現在的權重。

計算機視覺基礎之質心跟蹤演算法1

步驟1 接受邊界框座標並計算質心 步驟2 計算新邊界框與現有物件之間的歐幾里得距離 步驟3 更新 x,y 現有物件的座標 步驟4 註冊新物件 步驟5 登出舊物件 初始化下乙個唯一的物件id和兩個有序的用於跟蹤對映給定物件的字典 id到它的質心和它擁有的連續幀數分別被標記為 消失 儲存給定的最大連續幀...

計算機視覺演算法

講了乙個最小二乘法問題 存在四個不在一條直線上點,擬合一條直線,使這條直線能夠 誤差最小的穿過這四個點 雖然還不知道具體怎麼解。引申到矩陣的最小二乘法 有三個矩陣a,b,c,a為4 2,c為4 1,a b c.求b矩陣 求b,a矩陣是乙個非奇異矩陣,不可逆,所以讓a轉置左乘a構成滿秩矩陣c,可得b等...

計算機視覺CV 之 CMT跟蹤演算法分析二

這裡先說明一下,作者關於cmt演算法寫了兩篇文章 consensus based matching and tracking of keypoints for object tracking wacv2014 best reward clustering of static adaptive cor...