《新理解矩陣1》 矩陣是什麼?

2021-06-20 06:38:19 字數 3908 閱讀 1183

前邊我承諾過會寫一些關於自己對矩陣的理解。其實孟巖在《理解矩陣》這三篇文章中,已經用一種很直觀的方法告訴了我們有關矩陣以及線性代數的一些性質和思想。而我對矩陣的理解,大多數也是**於他的文章。當然,為了更好地理解線性代數,我還閱讀了很多相關書籍,以求得到一種符合直覺的理解方式。孟巖的blog已經很久沒有更新了,在此謹引用他的標題,來敘述我對矩陣的理解。

當然,我不打算追求那些空間、運算元那些高抽象性的問題,我只是想發表一下自己對線性代數中一些常用工具的看法,比如說矩陣、行列式等。同時,文章命名為「理解矩陣」,也就是說這不是矩陣入門教程,而是與已經有一定的線性代數基礎的讀者一起**關於矩陣的其他理解方式,僅此而已。我估計基本上學過線性代數的讀者都能夠讀懂這篇文章。

首先,我們不禁要追溯乙個本源問題:矩陣是什麼?

我們不妨回憶一下,矩陣是怎麼產生的。矩陣可以看成是乙個個向量的有序組合,這說明矩陣可以模擬向量;但是向量又是怎麼產生的?向量則是乙個個數字的有序組合,這又把我們的研究方向指向了「數字是什麼」這個問題上。比如,數字1是什麼?它可以代表1公尺,可以代表1千克,也可以代表1分鐘、1攝氏度甚至1個蘋果。它為什麼有這麼多的表示意義?答案很簡單,因為在本質上,它什麼都不是,它就是數字1,乙個記號,乙個抽象的概念。正因為它抽象,它才可以被賦予各種各樣直觀的意義!回到矩陣本身,我們才會明白,矩陣的作用如此之大,就是因為書本上那個很枯燥的定義——矩陣就是m行n列的乙個數表!它把矩陣抽象出來,讓它得到了「進化」。它是乙個更一般化的概念:乙個向量可以看作乙個矩陣,甚至乙個數都可以看成乙個矩陣,等等。

代數方面的理解

當然,上述說法是含糊的,我們還是需要確切知道它究竟有什麼用?這可以從代數和幾何的角度來分析,因為做到數形結合才是最完美的。首先我們知道數學最基本的元素就是數字,嚴格來說是自然數,如0,1,2,...;有了數字,我們就可以做到很多東西。但是數字是單一的,而我們很多時候都要批量處理一些類似的運算,比如同時要計算1+2,1+3,2+3,4+5這四個算式。不論是從記錄還是從研究的角度來說,分開研究它們都是比較繁瑣的。於是一種「批量」的記號產生了,我們記為(1,1,2,4)+(2,3,3,5),用兩個不同記號記錄它們,比如a=

(1,1

,2,4

),b=

(2,3

,3,5

) ,我們就可以將它記為a+

b 。這樣不論在研究還是記錄方面都能夠給我們方便。於是乙個我們稱之為「向量」的東西產生了,也就是說,從代數的角度來講,向量是為了研究批量運算而產生的。

但是向量並沒有解決所有的批量運算的問題。比如3元一次方程組a11

x1+a

12x2+

a13x3

=b1

a21x

1+a22

x2+a

23x3=

b2

a31x1

+a32x

2+a33

x3=b

3 單單用向量我們還是沒有辦法很好地研究這一類問題。於是我們就要想法子創造出一些新的記號,由於左邊的係數的具有一定的排列順序和統一的形式,我們不妨把它們單獨寫出來[a

11,a12

,a13]

[a21

,a22,

a23]

[a31,

a32,a

33]

並用乙個簡單的符號

a 來表示它,然後把未知數和右邊的常數都分別寫成向量形式x=

[x1,

x2,x

3]t 和b=

[b1,

b2,b

3]t (多加了上標t表示列向量)。我們期待上面的方程組可以寫成乙個簡單的形式ax

=b

由此我們可以定義乙個3階方陣乘以乙個3維列向量的乘法了,這是一種純粹的定義,是為了方便我們記錄和研究的定義。在此基礎上,我們就可以研究更多的東西,比如矩陣乘矩陣會得到什麼?

同樣,這裡要研究的矩陣都是指n階方陣這個最核心的東西,我們要先把核心問題研究透徹,不然一開始就考慮所有的繁雜的情況,容易讓我們陷入迷惘中而不知所措。

在研究一般乘法之前,我們先來了解一下關於運算定律問題。我們知道在實數中,加法滿足結合律和交換律,乘法滿足結合律、交換律和分配律。哪些定律可以遷移到矩陣乘法中的呢?交換律是無法先驗的,它是個定義問題,我可以定義它成立也可以定義不成立,但是為了運算的方便,我們還是希望它滿足更多地運算定律,所以我們先來考慮結合律,希望它能夠滿足這一定律。也就是說(a

b)x=

a(bx

) 其中

bx已經是我們所熟知的運算(由定義而來),它將得到乙個列向量,所以我們也可以輕易算出a(

bx) ,從直觀上來講,ab

應該也是乙個n階方陣,我們可以先把它設出來,然後與列向量x進行運算,最後把兩邊的結果一一對應起來,就得到了ab

這個n階方陣中各個元素的表示式。我們最終可以發現,它就是我們書本上定義的表示式。

以2階方陣為例,令a為

[a,b]

[c,d]

b為[e,f]

[g,h]

ab為[p,q]

[r,s]並令x

=[x,

y]t ,那麼(a

b)x 就等於[p

x+qy

,rx+

sy]t

而bx=[e

x+fy

,gx+

hy]t

,那麼a(

bx)=

[aex

+afy

+bgx

+bhy

,cex

+cfy

+dgx

+dhy

]t

那麼根據各個元素的對應,就得到p=ae+bg,q=af+bh,r=ce+dg,s=cf+dh。這就完成了2階方陣乘法的定義。

現在我們就可以從代數的角度來講,矩陣是為了簡化批量線性運算的乙個「終極**」!這就是矩陣的乙個比較直觀和有用的代數意義。

如果根據我們這個定義去考慮交換律,我們會發現矩陣一般不符合交換律。這不能不說是乙個遺憾。但是沒關係,它服從結合律這乙個事實,已經賦予了這個工具極大的力量。比如線性方程組ax

=y,我們有by

=b(a

x)=(

ab)x

,如果我們想辦法找到乙個矩陣

b ,使得ab

=i,那麼就很棒了,因為我只要用矩陣b作用於向量y就可以得到方程組的解了,事實上這樣的矩陣b是存在的,這就是逆矩陣。要是沒有結合律,這一切都免談!

由於這是實數基本運算(線性運算)的「批量版」,那麼我們就可以很自然地把實數的一些公式延伸為矩陣版(只要不是涉及到交換律就行)。比如,在實數中,我們有公式11

−x=1

+x+x

2+x3

+...

≈1+x

那麼我們求矩陣的逆陣時,也有類似的公式(i

−a)−

1=i+

a+a2

+a3+

...≈

i+a

其中i是單位矩陣,a是乙個「比較小」的矩陣。至於「比較小」怎麼定義,現在還說不清楚,可以認為是矩陣的行列式值比較小。類似的,根據1+

x−−−

−√≈1

+12x

也能夠相應地給出(i

+12a

)2≈i

+a,這是求矩陣「平方根」的乙個近似公式。

得益於我們定義的矩陣乘法,批量的運算可以直接用單個量的運算公式進行,不用我們煞費苦心、絞盡腦汁地構思新的公式。這就是矩陣的強大所在!它在解決很多線性問題時有著奇蹟般的美妙,最簡單的例子莫過於線性方程組ax

=y的解為y=

a−1x

,解答方程組的時候就好像求解一元方程那樣有簡單的形式!還有一些關於指數的定義等等,以後在應用時會把它介紹的。它們都好像非常精美的「藝術品」

下一回,我們將從幾何角度來理解矩陣。當然,這裡邊的絕大多數內容在孟巖的文章裡頭都已經提到了,我只是重提舊論而已,希望讀者不會厭煩。

矩陣乘法的本質是什麼

本題目前下面的解釋都是線性代數教材上的各種定義,但都太過複雜了。我嘗試寫乙個淺顯的解釋 小明今天要做飯,消耗2斤肉,1斤蔬菜。肉每斤20元,蔬菜每斤5元,則一共需多少花費?這個問題的答案很簡單 我們用向量相乘的方法寫出來 如果小明第二天有另一種做飯的方法,需要消耗1斤肉,4斤蔬菜,那麼這兩種方法的花...

線性矩陣到底是什麼

線性矩陣到底是什麼 對於乙個方程組,2x y 0 x 2y 3 把他們寫成矩陣就是,2 1 x 1 2 y ps 常稱之為ax b。從行去看,這個矩陣在描述的是兩個方程成線的交點,這是每個人都知道的。那麼從列去看 x y 1 1 所以這個線性矩陣的本質就在於求得x和y的組合使得 2,1 和 1,2 ...

tuxian本質矩陣和基礎矩陣是什麼,區別是什麼?

先了解下對極幾何,兩個相機在不同位置 實際要求光心位置不同即可 拍攝兩張圖,這個模型就是對極幾何,如下圖 摘自 計算機視覺中的多檢視幾何 兩攝像機光心分別是c和c 影象平面是兩白色的平面,空間中某乙個點x在兩張圖的投影點分別是x和x 這樣的模型就是對極幾何,空間點和兩光心組成的平面叫做對極面。簡言之...