為什麼點積等價於投影後的乘積

2022-02-20 09:54:17 字數 4233 閱讀 5911

先上結論:

\(\boldsymbol v\)和\(\boldsymbol w\)點積,就是向量乘法\(\boldsymbol v × \boldsymbol w^t\);

\(\boldsymbol w\)象徵著乙個降維變換矩陣,因此該矩陣乘法本質上是乙個\(\boldsymbol v\)降維的過程;

該降維變換在幾何上正是投影過程。

綜上,點積的幾何意義就是投影相乘。

要理解這一點,需要線性代數基礎,要理解矩陣和變換之間的關係。

我們所學的向量點積是這樣的:

其幾何解釋為:向量\(\boldsymbol w\)在向量\(\boldsymbol v\)上投影,投影長度和\(|\boldsymbol v|\)相乘。

借助這一幾何解釋,我們可以直觀地理解:

注意!理解、證明點積的對稱性,對我們的證明至關重要!

假設\(\boldsymbol w \bigodot \boldsymbol v\),對稱性的意思是:

無論是\(\boldsymbol v\)在\(\boldsymbol w\)上作投影再乘,還是\(\boldsymbol w\)在\(\boldsymbol v\)上作投影再乘,結果都是一樣的。

現在我們證明這一點。

如圖,假設二者長度相同,那麼對稱性顯然成立:因為投影長度是一樣的。

現在,假設\(\boldsymbol w\)更長。

我們在\(\boldsymbol w\)的方向上取\(\boldsymbol w'\),使得\(|\boldsymbol w'|\)等於\(|\boldsymbol v|\)。

我們先考慮\(\boldsymbol w' \bigodot \boldsymbol v\)。由於長度相同,對稱性是顯然的。

而\(\boldsymbol w \bigodot \boldsymbol v\),和\(\boldsymbol w' \bigodot \boldsymbol v\)只相差常數\(\alpha\)倍:

\[\alpha = \frac

\]假設現在有矩陣:

\[ \begin

1 & 0 \\

0 & 1 \\

\end

\]這是乙個單位陣,作用在任何乙個向量\([a,b]\)上,仍然會得到\([a,b]\)。

本質原因是:

顯然兩個基向量的位置都沒發生變化,因此這個變換沒有任何變化效果。

而\(a\)是基向量\(\boldsymbol i\)是權重,\(b\)是基向量\(\boldsymbol j\)是權重,\([a,b]\)可以拆解為\(a\boldsymbol i + b\boldsymbol j\)。

由線性性,對任意乙個向量\([a,b]\)進行線性變換,等於兩個分量分別變換,再相加。

因此任意乙個向量與單位陣相乘仍然是其本身。

再舉乙個例子。設有矩陣:

\[ \begin

1 & 0 \\

\frac} & \frac} \\

\end

\]與向量\([a,b]\)相乘,結果為:

\[[a,b] \begin

1 & 0 \\

\frac} & \frac} \\

\end = [a+\frac}b,\frac}b]

\]如果理解了矩陣和變換的含義,理解這個結果就特別簡單:

基向量\(\boldsymbol i\)紋絲不動,而基向量\(\boldsymbol j\)變換到了\([\frac}, \frac}]\)。

\([a,b]\)可以拆解為\(a\boldsymbol i + b\boldsymbol j\);

因此\([a,b]\)變換到了\(a[1,0] + b[\frac}, \frac}]\),結果就是\([a+\frac}b,\frac}b]\)

線性性對我們的證明特別重要,可以解釋為什麼能分別對基向量作變換,再疊加。

我們都知道,線性性包含齊次性和疊加性。

要證明某乙個變換是線性變換,就必須證明該變換具有這兩個性質。

我們在這裡省略嚴格的證明,換乙個直觀的角度予以證明。

線性變換有乙個直觀的特點:

在二維空間中,如果有一系列等距分布於同一直線上的點:

那麼線性變換之後,這些點在數軸上仍是等距分布的

該過程滿足保持等距條件。

因為如果把作用向量放大\(\alpha\)倍,實際上就是把兩個基向量的權重分別放大\(\alpha\)倍。

被變換作用後再疊加,效果也是放大\(\alpha\)倍。因此等距點仍然是等距點。

這樣,我們就粗略說明了該變換是線性變換。

因此我們完全可以認為:

向量[2,1]表徵乙個從二維到一維的線性變換,將基向量\(\boldsymbol i\)變換至數軸點2,將基向量\(\boldsymbol j\)變換至數軸點1。

現在,我們解釋為什麼點積可以用投影後的乘積來解釋。

我們先來看乙個單位向量\(\boldsymbol u\)

由於是單位向量,因此\(\boldsymbol i = [1,0]\)往\(\boldsymbol u\)上做投影,和\(\boldsymbol u\)往\(\boldsymbol i = [1,0]\)(也即x軸)上做投影,長度是一樣的!

也就是說:圖中綠色虛線投影得到的投影長度,等於\(\boldsymbol u\)的橫座標\(u_x\)。

同理:圖中紅色虛線投影得到的投影長度,等於\(\boldsymbol u\)的縱座標\(u_y\)。

好了。此時假設向量\(\boldsymbol w\)要和單位向量\(\boldsymbol u\)點積。

由上一節推出的性質,基向量在變換\(\boldsymbol u\)下,會分別對映(降維)到點\(u_x\)和\(u_y\)。

設\(\boldsymbol w = [w_x,w_y]\),那麼\(\boldsymbol w\)就會對映到\(w_xu_x+w_yu_y\)。

這就是點積!!!

所以,為什麼可以理解為:\(\boldsymbol w\)先投影到\(\boldsymbol u\)上,再做乘積呢?

\(\boldsymbol w\)可以拆解為基向量的加權組合。

每乙個基向量與變換\(\boldsymbol u\)(先規定為單位向量)作用的結果,又可以分為:

該變換相當於投影到\(\boldsymbol v\)所在數軸上的一點

該點的座標,正是\(\boldsymbol u\)的橫座標或縱座標

由線性性,基向量分別變換後再相加,等價於向量\(\boldsymbol w\)整體變換的結果。因此我們把兩個投影值相加,就得到了最終結果。

因此,從計算過程上看就是:座標和權重相乘,再相加。這就是點積!

從投影過程上看:\(\boldsymbol w\)在\(\boldsymbol v\)上投影,恰好也可以拆分成兩個基向量在\(\boldsymbol v\)投影的疊加。因此點積都是投影!

如果\(\boldsymbol u\)不是單位向量,再乘以其範數即可。這就是完整的點積:投影→相乘!

解釋完畢!

我為什麼「鍾情」於Ubuntu

ubuntu 的 好活 對此,有人非常惱火,想告我的狀 說我有意 攪局 我為什麼喜歡 ubuntu呢?這得從4 年前的故事說起。2004年11 月,我那時在福州軟體園,初次遇見 ubuntu 4.10 後來,我就鼓動公司老闆,給我建立了乙個 ubuntu 實驗室 起初,ubuntu 實驗室 只有2 ...

除了投SEM競價廣告,為什麼還要投原生資訊流廣告

除了投sem競價廣告,為什麼還要投原生資訊流廣告?沒有競品資訊的干擾,只要你的銷售策略讓使用者舒適,就能拿到他的名片,這是原生廣告 即資訊流 最優勢的地方。原生廣告和搜尋廣告的重要區別在於 影響力時段 不同 評估模式 不同 作為原生廣告從業人員,經常要受到初次接觸feed廣告的客戶這種靈魂拷問 搜尋...

定投第1天 我為什麼投資位元幣

小碼哥第一次聽說位元幣是在2012年,當時覺得乙個虛擬的貨幣能賣這麼貴,肯定是泡沫。一直到2017年,才進入幣圈,開始投資和研究位元幣以及背後的區塊鏈技術。這件事情讓我付出了巨大的代價,錯過千載難逢的機會,後悔不已。現在想想,最大的問題還是出在認知本身。當聽到乙個新的事物的時候,用老思維去判斷,而且...