因子化技術和秩理論的2D到3D 的重建技術

2021-06-13 23:33:41 字數 3162 閱讀 8354

因子化技術和秩理論的2d到3d的重建

由二維影象構建三維人臉:即從一組己知2d人臉資訊構建三維人臉。通常這種方法所需的影象輸入裝置**比較低廉。但人們很難從2d影象擒取足夠的圖形資訊,因而很難使三維模型做到準確。要提高三維人臉的精確度就要以盡可能多的在二維影象上建立基準點為代價。

人臉是塑性變形體,對於人臉的特徵抽取和識別,更適合用彈性模型來描述,任何基於剛性的特徵抽取方法都難以達到令人滿意的效果。從應用的角度上看,如果使用者只關心剛性運動,那麼就只須建立簡單的幾何模型就可以滿足要求。橢圓和圓柱的模型已經得到成功的應用,並且取得較好的對臉部形狀的近似效果。但是由於運動的模糊帶來了形狀的模糊,使得剛性模型無法勝任,超二次曲面可以更好的近似臉部模型,這是包括**和肌肉動態臉部運動的生理模型,變形輪廓線可以對肌肉精確運動進行控制和評估。

因子化技術

當物體深度或者場景結構遠小於物體到攝像頭的距離時,我們通常對攝像頭採用弱透視投影假設,這種假設被廣泛用於限定形狀和非限定形狀物體形狀恢復,而這些方法往往都是基於因子化技術。

因子化技術是由tomasi和kanade[2]提出的,用於正交投影模型中限定性形狀的重構。後來該方法被擴充套件到弱平行透視攝像頭模型。作者指出,在這種估計的攝像頭模型下,用來表達限定性形狀物體的秩為4的矩陣是由乙個秩為4的運動矩陣和乙個秩為4的形狀矩陣的乘積。不論該形狀包含多少參考點,也不管有多少張影象參與運算,這個特點始終成立。很快,因子化技術被用於實現線形約束下f交旋轉變化矩陣的分解,並用於針對單目標影象中單一3d形狀和運動資訊的恢復。

如果把該方法擴充套件到多個可變形形狀物體的重構,那麼我們要分析這些形狀的線性復合。我們需要考慮線性模型的因子化方式,在這個方法中測量轉換矩陣的秩是3k+i的,k是影象中包含的形狀個數。這個方法強調基於正交旋轉矩陣的線性約束,以因子化測量矩陣來恢復限定性模型、潛在的形狀模型和相關的混合係數。通過復合係數來調整可變形狀模型的復合。這個線性演算法被擴充套件採用三重線性優化方法來完成。在每一步迭代中,三組引數中有兩組是已知的,而另一組要被推導出。這三組引數分別是:形狀基,混合係數,限定性運動。相似的非線性優化方法也被提出,它採用線性方法作初始化。但是以上演算法都會產生大量的變數,係數的個數與參與計算的影象數和目標形狀的個數二者乘積有關。這些方法的效能依賴於初始化猜測的質量。並且,以上方法很多受到旋轉約束的侷限,而不一定能獲得乙個有效的解。

問題描述:

給出f幀影象,並在每一張影象上都標定p個特徵點                              ,我們的目標就是恢復非限定形狀物體的運動,包括旋轉係數 和平移係數 ,並且恢復給物體的3d形狀 ,文章中,我們假設:

1,彈性形狀可以看作幾個形狀基的復合。

2,3d結構和攝像頭運動是非兼併的。

3,攝像頭投影模型滿足弱透視攝影關係。

遵循文獻[24 25]中的描述,我們把 影象特徵點的2d水平座標 寫成乙個 ,在這個矩陣中每一行表示一幀影象,每一列表示乙個特徵點。,同時,我們把2d垂直座標 也寫成這樣的 ,從而得到乙個

我們稱為這個矩陣為測量矩陣,我們對w矩陣的每一行作歸一化對齊,

其中, 是每一行的平均值。

於是我們得到乙個註冊測量矩陣 ,這個矩陣就是我們演算法的出發點。

矩陣秩理論

我們只是考慮單目標重構的問題,在弱投影的假設下,投影模型可以寫成:

其中 表示第f幀的攝像頭旋轉, 表示對參考座標系的平移量。 代表投影後的比例因子,假設我們把參考係 原點與p個特徵點的中心重合,座標 這些特徵點是在影象流中通過某種方式來確定的,在某一幀f中,攝像機旋轉參考係是由一對單位向量確定的, 。

投影座標可以用一下引數表示:

同樣對於 有同樣的表示式。我們得出:

由上面的公式我們可以得到測量矩陣的表示為:

其中r表示攝像頭的旋**

s代表形狀矩陣:

換個角度,r表示在影象序列中攝像頭軸角引數,而s表示p個引數座標點相對於形狀中心的位置。r矩陣的大小是2f*3,同時s 矩陣大小是3*p,那麼方程滿足如下定理:

矩陣秩定理:在沒有雜訊的情況下,註冊測量矩陣是秩為3的矩陣。

從矩陣秩理論中我們看到2f*p的影象測量含有相當高地冗餘,實際上可以把這組資料簡單的概括為給定f幀的參考座標係以p個座標向量,當然一般情況下,我們只是已知的條件。在上面的的公式中 和 都是互相正交單位向量,必須滿足如下限制:

同時,當系統引數校準後旋轉矩陣r就是唯一的,校準系統引數可以根據第一幀的攝像頭位置來做,我們這裡用:

在沒有雜訊干擾時,註冊矩陣w一定是乙個秩為3的矩陣,當有雜訊干擾時,矩陣理論就要進一步擴充套件。

仿射模型估計

假設2f>p,矩陣w可以被分解成2f*p矩陣 和乙個p*p的對角矩陣 以及乙個p*p的矩陣。

以上矩陣滿足 , 是乙個對角矩陣,對角線上得數值是降序排列的矩陣的奇異值,這就是矩陣w的奇異分解(svd).

現在我們只考慮矩陣 的前三列, 矩陣是上3*3子對角矩陣。還有就是 矩陣的前三行。我們把矩陣重新分割,可以寫成:

假設是乙個理想的註冊測量矩陣,該矩陣完全沒有雜訊干擾。基於矩陣秩理論,這個註冊矩陣至多有三個非零奇異值,,由於在 中的奇異值是降序排列。那麼在 中必然含有測試矩陣中濾除雜訊之後所占有的奇異值。而 對應的是雜訊。因此我們所需要的秩為3的理想註冊測量矩陣就是下面的形式:

那麼在有雜訊干擾情況下的矩陣理論應該描述為:

有雜訊的矩陣秩理論:

矩陣 中所有的形狀和旋轉資訊都是包含在其三個最大的奇異值中,以及這三個特診值對應的左右特徵向量。

現在我們定義:

那麼我們就為:

上面兩個矩陣和所需要解的旋轉矩陣以及形狀矩陣大小相同。 是 ,而 是 ,不過這種分解不是唯一的。假設 是任意的 可逆矩陣,那麼 和 同樣是矩陣 的有效分解結果。

因此,濾除了雜訊的矩陣r就是真實的旋轉矩陣的線性變換,同時矩陣s是真實的形狀的線性變換。因此矩陣秩理論,w矩陣的列空間是三維的,而r與 是對應相同空間的不同基,因此,這兩者之間必定存在乙個線性變換。雜訊的等級是不是可以忽略。這也和攝像頭對於形狀的姿態有關。不過,經過分析由奇異值分解的資料後使我們認為這個方法是有效的,因此 矩陣的奇異值中第三最大奇異值和第四最大奇異值的差別非常顯著。

矩陣約束

我們發現矩陣 是矩陣 的線性變換,同時 是矩陣 的線性變換。其中存在乙個3*3可逆矩陣q滿足:

為了確定q,我們注意到真實的旋轉矩陣r是單位向量組成的,由行資料得到的向量與由列資料得到的向量相互正交,這樣我們就得到乙個矩陣約束:

2D縮放和3D位移

2d 平面空間的元素變形。變形屬性 transform transform的屬性值為功能函式。2d功能函式 2d的位移 2d的旋 2d的縮放 2d的傾斜 transform translate x,y 位移 transform translatex x軸移動的距離 transform transla...

2D到3D 外參矩陣估計

1.背景 最近正在做姿態估計,簡單搜姿態估計的關鍵字得到的資訊不夠完整,所以把搜到的資訊加上自己的理解整合在這篇文章。2.正向3d到2d的過程 首先3d物體在世界座標系,也就是我們現實世界,物體是現實中的絕對尺寸,以m為單位。現實世界的物體認為成剛體,那麼這個剛體和相機之間會有乙個相對位置。對於物體...

css3的2D和3D效果

2d效果 1.css3過渡,讓動畫更柔和,transition ie10 firefox chrome opera支援,chrome25以及更早版本safari需要新增 webkit transition width 0.5s ease 1s delay transition all 0.5s 常用...