hessian矩陣快速理解偏導數與海森矩陣

一階與多階連續偏導數

一階偏導數：

對於z=f(x,y) 這個二元函式來說，有兩個一階偏導數：

假設 z 在(x0,y0) 處及其附近有定義，若一元函式(注意我們這裡把y=y0當做y為常數y0)f(x,y0) 在x=x0 處可導，那麼就稱此導數值為二元函式z=f(x,y)在點(x0,y0)處對x的一階偏導數：

同理，對於f(x,y)的第二個一階偏導數關於y的是：

二階偏導數：

二階偏導數就是一階偏導數的一階導數。對於z=f(x,y)來說，有4個二階偏導數。:

如果對於3元函式的二階偏導數就是9個，一共有3個一階偏導數，每個一階偏導數有3個二階偏導數。例如(x,y,z) 二階偏導數就是對 (xx,xy,xz)(yx,yy,yz) (zx,zy,zz) 分別求偏導也就是乙個3x3的方陣，這個方陣就是海森矩陣，黑塞矩陣 hessian。

其中第一行實際上是f(x,y,z) 對x的一階偏導數的偏導數。f對x的一階偏導數是：

而f'的一階偏導數也有3個就是上面方陣的第一行的3個元素，每個元素代表了x的一階偏導數的關於x，y, z 的一階偏導數

(1)當a正定矩陣時，在m處是極小值；

(2)當a負定矩陣時，在m處是極大值；

(3)當a不定矩陣時， m不是極值點。

(4)當a為半正定矩陣或半負定矩陣時,m是「可疑」極值點，尚需要利用其他方法來判定。

偏導與梯度:

梯度與導數關係：梯度本身是乙個向量，指向函式增長變化最快的方向。而梯度這個向量裡每乙個維度的值就是對這個維度求偏導的值。梯度向量的維度和引數的個數是一樣的。例如w是乙個權值矩陣，共有(5,6)的維度，就意味著有30個引數，我們的梯度向量就是乙個30維度的向量。

使用損失函式loss, 對函式的權重的每乙個引數求偏導。求得的每乙個引數的偏導數組成的向量，就是我們要的梯度。

hessian矩陣 快速理解偏導數與海森矩陣