變換不變性

2021-06-19 22:27:11 字數 2748 閱讀 5527

mit大牛林達華

變換與不變是數學裡面最令人神往的一對矛盾統一。所謂「變換不變性」,以不變刻畫變化,其核心深刻反映了這種對偶的關係。

變換不變性貫徹於很多具體的數學領域之中,對它的全面討論遠非我力所能及。這篇文章只是討論它的乙個簡單例子,希望通過乙個小小的視窗管窺這個世界的奧妙。

何謂旋轉?

這篇文章只想很初步地回答兩個基本的問題

1.       什麼叫做旋轉(rotation)?

2.       什麼東西被旋轉後是不變的(具有旋轉不變性)?

為了簡單起見,只考慮二維空間,它到高維的推廣也並不特別困難。在代數上,所謂旋轉,可以用下面的方程表達:

x』 = x cos(t) – y sin(t);   y』 = x sin(t) + y cos(t)。

但是,這樣一種表達並不能給人以直觀的感覺。所以,我們還是回到幾何本身來看待這個問題。什麼東西旋轉後是不變的呢?「東西」這個概念太模糊了,在數學上,我們討論問題得首先指定乙個範圍,就是所謂「物件的集合」。這裡,我們先考慮最簡單的幾何構造——點,我們討論的全集就是整個二維空間的點集。那麼上面的問題,就細化為「哪些點旋轉後是不變的?」 答案是非常顯而易見的,只有一點——就是原點。

這樣,我們得到了對於旋轉變換的第乙個變換不變性:原點不變。可是,這麼個條件太寬了,我們很容易找到別的變換,比如縮放,它也是原點不變的。因此,依靠單點的不變性在這裡並不能非常有效地刻畫變換的特點,我們需要更強大的對不變性的表達。

從「原點不變」到「圓不變」

於是,數學界從對乙個點的變換,推廣到對乙個集合的變換。比如集合 x = , 那麼乙個變換 t 施加到集合上,得到「變換後的集合」就是:t (x) = 。 如果有 t(x) = x,我們說集合x是變換不變的。 事實上,t(x) 和 x 只要包含相同的那堆元素就行了,每個單個的元素都允許被變化到另一點的。

這個推廣看似簡單,看是表達能力完全不在了乙個層次上。比如,乙個集合如果有n點的話,它就有2^n個子集,如果只考慮單點,我們只能看n個東西,而如果允許考慮子集的話,我們能看2^n個東西,傳遞的資訊自然也豐富得多。

基於「集合的變換不變性」這個概念,我們可以找到這麼一些點集——「以原點為圓心的圓」,它們是旋轉不變的。「圓不變」比前面的「原點不變」進步了很多,已經在相當程度上刻畫出了旋轉的特性,最起碼,剛才那個反例「縮放變換」被排除了。如果我們把變換限定為仿射變換(affinetransform),那麼我們已經基於「圓不變性」得到對旋轉的嚴格定義:「旋轉就是圓不變的彷射變換」。

「旋轉不變的集合」並不僅僅是圓,事實上「不同半徑的圓的任意並集」都是旋轉不變的,反過來,任何旋轉不變的集合都是圓的並集。這樣,以「圓」為基(basis),通過任意並集生成(generate)的集簇(collection of subsets)就對應於全部旋轉不變的集合。

這裡,我們得到了兩個大集合:,,這兩個集合都分別同胚於一維實空間,總維數是2,等於原空間的維數——這個結果並非偶然,它其實就是李群論中變換空間,軌跡空間(商空間),和原空間的維數關係定理的乙個特例。

我們把討論的範圍限定為仿射變換(包括了平移,旋轉,拉伸,縮放和它們的各種合成變換)的情況下,圓不變完整地刻畫了旋轉變換。旋轉(變換)和圓(不變性)構成了一對對偶。

從「旋轉——圓」到「變換群——軌跡」

旋轉對應於圓,這個我們甚至可以直接觀察得到。但是,對於一般的變換呢,我們如何找它們的不變集?這需要把概念推廣到:「變換群」和「軌跡」。

乙個變換群,就是指一群可逆變換,對於「合成」是封閉的——群裡面兩個變換的合成必然還在群裡。所以,旋轉是乙個變換群:因為旋轉再旋轉還是旋轉。對於空間一點,把變換群中每個變換都對它施加一下,那麼,就可以得到乙個集合,叫做「軌跡」。比如旋轉群,它(各種角度的旋轉)施加於任意一點,就得到乙個圓,那麼圓就是旋轉的軌跡。由於變換群對於合成的封閉性,可以證明,對於任何乙個變換群,它施加於任何一點得到的軌跡是變換不變的。這樣,我們從「旋轉——圓」的對偶關係,進一步推廣到了「變換群——軌跡」的對偶關係,從而我們獲得了以軌跡刻畫變換的方法,這通常比代數方法更為直觀和具有更加鮮明的幾何意義。

如果變換是自由的,「就是說不同的變換施加於同一點會有不同結果」,那麼,變換群和所有軌跡組成的空間(商空間)具有乙個結論:它們的維度之和等於原空間維度。這在一定意義上,反映出它們的關係是「互補」的。

概率分布的「變換不變性」

進一步的,我們剛才把變換的物件,從點推廣到集合,得到了很多重要的觀察。那麼,這個事情還可以進一步延伸。假設說,我們有乙個空間概率分布,就是乙個點以一定的概率出現在空間各處,對這麼乙個隨機點,施加乙個變換,在變換後的時刻,得到的點依舊是乙個空間分布,變換後的分布是由變換前的分布和變換本身共同決定的。我們也可以這麼理解,我們「對整個分布」進行了變換,得到了新的分布。

哪些分布是「旋轉不變呢」?就是說,分布旋轉後還是同樣的分布。我們很容易找到一些:比如標準高斯分布,圓盤裡面的均勻分布,等等。為了更清楚地說明這個問題,我們需要更明確的條件。對於連續分布,有乙個很容易得到但是很重要的結論:如果這個分布在所有的軌跡上都具相等的概率密度,那麼,這個分布是變換不變的。特別的,如果乙個分布在每個圓上都是等概率密度,那麼這個分布旋轉不變。

反過來,標準高斯分布對於乙個變換是不變的,那麼這個變換是不是必然是旋轉呢?

以變換不變性為橋梁,我們可以發現概率分布和幾何有著某種內在的聯絡。一直以來,我們討論分布時,都關注它的代數形式,而事實上分布的幾何形態同樣蘊含著豐富的資訊,也提供了不同的視角。變換不變性,則是**這個問題,從而建立概率論和幾何學的聯絡的乙個重要工具。

另外,在隨機過程中,對於轉移變換的變換不變性,對於描述過程的「各態歷經性」(ergodicity)也有著密切的關係。

ORB尺度不變性

尺度不變性是由構建影象金字塔,並在金字塔的每一層上檢測角點來實現的 高斯金字塔構建,為了讓尺度體現其連續性,高斯金字塔在簡單降取樣的基礎上加上了高斯濾波,將金字塔每層的一張影象使用不同引數做高斯模糊,使得金字塔的每層含有多張高斯模糊影象,將金字塔每層多張影象合稱為一組,金字塔每層只有一 像,組數和金...

特徵提取之旋轉不變性和尺度不變性的通俗理解

特徵匹配 feature match 是計算機視覺中很多應用的基礎,比如說影象配準,攝像機跟蹤,三維重建,物體識別,人臉識別,所以花一些時間去深入理解這個概念是不為過的。本文希望通過一種通俗易懂的方式來闡述特徵匹配這個過程,以及在過程中遇到的一些問題。首先我通過幾張來指出什麼是特徵匹配,以及特徵匹配...

數學論道 讀《不變性與可變性》

昨天讀了一位大哥的文章 不變性與可變性 2480763.aspx 裡面講到了道 老子的道,用數學的觀點分析了什麼是道,他說他很有感觸,想發一些感慨,我讀了他的文章後更是想發洩一番。道是什麼,道就是永恆的東西,不變的東西,讓你感到沒有什麼用的東西.道是說不清的東西,既然說不清我就不說了,大哥會飛的魚寫...