利用特徵值分解理解矩陣特徵值和特徵向量的幾何意義

2021-08-20 19:21:49 字數 2020 閱讀 2745

本文發自:

一直有乙個疑問,矩陣的特徵值和特徵向量到底代表了矩陣的什麼性質?尤其是特徵值還被稱為矩陣的eigenvalues ,然後看了知乎上的一些解釋,也未能得到較好的理解,有些太理論:)

然後本文就從自己現有知識體系下解釋一下矩陣的特徵向量與特徵值的幾何意義。有如下公式,$ x ,y $為向量,$ a $為矩陣,而且是方陣,因為只有方陣才有特徵值和特徵向量的概念,我會在最後給出非方陣的分析,基於svd的理解,但不是很透徹,僅作為了解。

$$ y = ax$$

本文主要分析矩陣$a$的特徵值在這個過程中到底起到了怎麼樣的作用。

首先你需要了解以下知識

座標變換建議閱讀:

座標變換想做什麼事呢?假設$n$維空間有兩組線性無關的基 $$,$$,它們一定可以互相表示,有以下公式成立,記過渡矩陣為$c$,當$$為標準正交基時,$[β1,...,βn]=c$ ,下圖的第乙個公式稱為基變換。

此外還有座標變換,向量$γ$在基底$α1,α2,...,αn $的座標是$x_1,x_2,...,x_n$,在基底$β1,β2,...,βn$下的座標是$y_1,y_2,...,y_n$則座標變換公式如下 ,注意座標變換與基變換中$c$的位置不同

特徵值分解就是矩陣的對角化,就是可以將$a$分解為下面的形式,$q$是由對應特徵向量組成的矩陣,列向量是特徵向量,$σ$為對角矩陣,對角線上的元素為$a$的特徵值。

$$a = qσq^$$

並不是所有方陣都可以對角化,方陣a可以被對角化的條件是

實際上都是為了保證$q$是可逆的,如果存在$n$個線性無關的特徵向量,則矩陣$q$一定可逆 。

這個網上有許多介紹,我就不贅述了。任意矩陣都可以進行svd分解。

$a$是方陣,因此$ax$後得到的$y$仍是原空間的乙個向量,沒有投影或者公升維的過程。從結果來看,$a$的作用是將$x$旋轉一定角度並拉伸。

那具體如何過程是怎樣的,首先將$a$做特徵值分解,$ax=qσq^x$,$q$是滿秩的也就是列線性無關,可以看作是原空間的一組基,所以$q^x$可以看作是座標變換,其含義是將$x$變換到新的基下(對於同乙個過渡矩陣$c$,基變化和座標變化是反向的),這些基由特徵向量構成,特徵向量是線性無關的但不是正交的(實對稱矩陣特徵向量正交),再與$σ$相乘,$σ$是對角矩陣,其含義就是將$x$沿著變換後的座標軸縮放,這裡的比例係數是新的基(特徵向量)對應的特徵值,然後再乘以$q$變回到原始的標準座標系下。

上面的操作等價於在標準座標系下沿著特徵向量的方向直接縮放,每個方向縮放的尺度就是對應的特徵值。以上兩種不同的操作最後可以得到同樣結果,即$x$被旋轉並縮放。實際上是把$x$朝特定的方向縮放,使我們產生了$x$被旋轉的感覺。

那麼如果我們將$x$乘以很多遍$a$會有什麼效果?從上述分析可以得到,$x$會被拉伸到$a$的最大特徵值對應的特徵向量的方向上。這裡盜圖一張。

普通$n$階方陣一定有$n$個特徵值,對應$n$個特徵向量,但是特徵向量不一定是線性無關的,所以不能對其進行特徵值分解(以下分析不太嚴謹),但我們可以認為這只不過是對應的拉伸的方向少了一些,比如此時只有$m(m

非方陣的話就不存在特徵值和特徵向量的概念了,其實不屬於本文的討論的範圍,但簡單說一下,我們可以對$a$矩陣進行svd分解。

svd分解可得到如下形式,$u$,$v^t$是正交矩陣,$σ$是奇異值矩陣,只有對角線元素有值,$ax$的意義是先在原空間內做旋轉,再投影$(m<n)$到低維空間並縮放(奇異值)倍,或公升維度$(m>n)$到高維空間並縮放(奇異值)倍,然後在新的空間內旋轉。結果就是向量$x$被旋轉、縮放、投影或公升維。

特徵值分解

一 特徵值與特徵向量的幾何意義 1.矩陣乘法 在介紹特徵值與特徵向量的幾何意義之前,先介紹矩陣乘法的幾何意義。矩陣乘法對應了乙個變換,是把任意乙個向量變成另乙個方向或長度的新向量。在這個變化過程中,原向量主要發生旋轉 伸縮的變化。如果矩陣對某些向量只發生伸縮變換,不產生旋轉效果,那麼這些向量就稱為這...

特徵值 特殊矩陣的特徵值和特徵向量

特徵值與特徵向量 2 前 言 1 今天我們來討論一類特殊矩陣的特徵值和特徵向量。秩1 矩陣的性質希望同學們還沒有完全遺忘,正好通過今天的內容帶著大家複習下。2 i 雖然今天的矩陣不是抽象矩陣,但是想通過定義法求特徵值較為麻煩。這裡我們需要做乙個轉換 ax 0有非零解說明0是a的特徵值。ii 這裡我們...

特徵值分解和SVD分解

一 特徵值與特徵向量的幾何意義 1.矩陣乘法 在介紹特徵值與特徵向量的幾何意義之前,先介紹矩陣乘法的幾何意義。矩陣乘法對應了乙個變換,是把任意乙個向量變成另乙個方向或長度的新向量。在這個變化過程中,原向量主要發生旋轉 伸縮的變化。如果矩陣對某些向量只發生伸縮變換,不產生旋轉效果,那麼這些向量就稱為這...