易忘的數學概念

2022-01-24 01:08:11 字數 2874 閱讀 9030

求曲面$f(x^,...,x^)=0$在$(x^_0,...,x^_0)$處的法向量(有$f(x^_0,...,x^_0)=0$),實際上就是求$z = f(x^,...,x^)$在$(x^_0,...,x^_0)$處的梯度。而顯式函式的梯度通常是很好求的,只要求偏導數即可。

這是因為,原本的低維函式$f(x^,...,x^)=0$,實際上就是拓展後的高維函式$z = f(x^,...,x^)$在$z=0$處的等高線,而與等高線垂直也就是增長最快的方向,就是它的梯度了。

另外,由於梯度指向的是函式增大的方向,所以這樣求出的法向量方向指向的是$f(x^,...,x^)>0$的區域。

$\sum\limits_i^n a_i \sum\limits_j^m b_j = \sum\limits_i^n\sum\limits_j^m a_ib_j$,這是因為:

$(a_1+...+a_n)(b_1+...+b_m) = [a_1(b_1+...+b_m)+...+a_n(b_1+...+b_m)]=(a_1b_1+...+a_nb_m) $

內積$xy$的實際上就是$x$在$y$方向的軸上的座標,如果$y$是單位向量的話。

對稱矩陣$a$一定能分解為某個矩陣與其轉置的乘積:

$a = bb^t$

但因為$b$不一定是實數矩陣,如:

$ \left[ \begin -1&0 \\ 0& 1\\ \end \right]=\left[ \begin i&0 \\ 0& 1\\ \end \right]\cdot \left[ \begin i&0 \\ 0& 1\\ \end \right]$

所以不能由

$x^tax=x^tbb^tx=(b^tx)^tb^tx\ge0$

得出對稱矩陣一定半正定。而如果對稱矩陣由實數矩陣與其轉置的乘積定義,就能得到該對稱矩陣半正定,比如協方差矩陣:

$\sigma = (x-\mu)(x-\mu)^t\succeq0$

前前後後看了好多遍,從pca計算協方差矩陣,到svm正定核的判斷,再到風格遷移中的adain,都用到了格拉姆矩陣。每次都要找資料再看一遍定義,而看別人寫的部落格效率總是沒有自己寫的高的。現在將它記錄下來,以求忘得更慢一些,至少能在忘記的時候快速回憶起來。

對於$n$個$m$維列向量構成的矩陣$x = [x_1,x_2,...,x_n]$,這組列向量的格拉姆矩陣定義為:

$g = x^tx= \left[ \begin x_1^tx_1&x_1^tx_2&...&x_1^tx_n\\ x_2^tx_1&x_2^tx_2&...&x_2^tx_n\\ \vdots&\vdots&\ddots&\vdots\\ x_n^tx_1&x_n^tx_2&...&x_n^tx_n\\ \end \right] $

實際上就是將這組向量的所有內積組合成乙個矩陣。當然,還可以對它進行拓展,比如,對於一組矩陣,它們對應的格拉姆矩陣上的元素值就是兩兩矩陣按元素進行的乘積和。還有其它的拓展方式很多,我們可以大膽想象。

格拉姆矩陣通常用來表示各個向量之間的相關性,為了增強可比性,在求之前我們可以先對它們進行預處理,如標準化——也就是減去均值除以標準差,或者規範化——也就是除以範數。

當然,因為各行各列都能表達某個向量與其它所有向量之間的相關性,所以不進行上述預處理也是可以獲取「相對來說的」相關性的。比如樣本協方差矩陣,就是隨機變數減去均值後,求格拉姆矩陣,再除以樣本數。它沒有除以標準差,這是因為協方差矩陣除了要表達各個隨機變數之間的相關性外,還要表達隨機變數的方差。而當我們對隨機變數減去均值,再除以標準差,然後再計算這個「協方差矩陣」時,我們會發現它成了相關係數矩陣,而相關係數矩陣就僅僅表達各個隨機變數之間的相關性了。

對於任意$n$階實半正定矩陣$m$,因為它實對稱,所以可以正交對角化:

$m = q\lambda q^t$

其中$\lambda$為$m$所有特徵值$\lambda_i$排列成的斜對角矩陣。又因為它半正定,有$\lambda_i\ge 0$,所以可以將$\lambda$表示為:

$\lambda = \lambda^\lambda^ $

$\lambda^ = \text(\sqrt,\sqrt,...,\sqrt)$

於是有:

$\begin m &= q\lambda q^t\\ &= q\lambda^\lambda^ q^t\\ &= (\lambda^q^t)^t\lambda^ q^t \\ &=a^ta \end$

\begin \begin p(x,y) = \frac}\exp\left(}\right) \end \end

下面求$y$的邊緣分布。首先進行配方:

\begin \begin p(y) &= \int\limits_r \frac}\exp\left(\frac\right) \text x\\ &= \int\limits_r \frac}\exp\left(\frac\right) \text x\\ &= \int\limits_r \frac}\exp\left(-\frac - \frac\right) \text x\\ \end \end

然後換元,令

\begin \begin v = \frac} \end \end

然後積分得:

\begin \begin p(y) &= \int\limits_r \frac}\exp\left( -\frac\right) \text \left(\sqrtv+\rho y\right)\\ &= \int\limits_r \frac\exp\left( -\frac\right) \text v\\ &= \frac}\exp\left( -\frac\right) \int\limits_r \frac}\exp\left( -\frac\right) \text v\\ &= \frac}\exp\left( -\frac\right)  \\ \end \end

獲得的是標準正態分佈。可以看出,邊緣分布$p(y)$與聯合分布的相關係數$\rho$並無關係,也例證了不同的聯合分布可以有相同的邊緣分布。

linux的常用易忘命令

1.檢視軟體安裝路徑 root localhost which gcc usr bin gcc 查詢程序 ps ef grep redis 檢視埠 netstat lntp grep 6379 檢視檔案大小 root bsso yayu du h max depth 1 work testing 2...

常用易忘的CSS技巧

超出部分顯示省略號 單行文字 wrap 多行文字 wrap 自定義滾動條 overflow y scroll 整個滾動條 webkit scrollbar 滾動條的軌道 webkit scrollbar track 滾動條的滑塊 webkit scorllbar thumb 修改input輸入框中游...

python 易忘語法筆記

python vpython3 中,可以用中文作為變數名,非ascii標識碼也是允許了。通常情況下不建議使用 我們不能將他們用作任何識別符號名稱。利用標準庫提供的keyword模組,可以輸出當前版本的所有關鍵字。import keyword keyword.kwlist false none tru...