Andrew機器學習課程 章節15 降維

2021-09-03 02:49:45 字數 425 閱讀 3143

作用:1壓縮資料 來減少儲存資料所需要的空間

儲存方差保留的百分比  99%

2.視覺化

特徵高度相關

data visualization

pca找到乙個面,使點到線段的長度平方和最小。

1.先進性均值歸零化。

找到乙個向量,使其表示能夠最小化投影誤差的方向。

將n維降為k維,故我們要尋找k個向量來對資料進行投影。

投影到這k個向量展開的線性子空間上

超平面上。

pca與liner regression的區別

奇異值分解得到u s v三個矩陣

u為nxn矩陣。而我們需要的就是u的前k列構成的線性子空間。

Andrew機器學習課程 章節5 正則化

理論上n個n次項係數可以完全擬合乙個通過n 1個點的曲線,當引數無限時,我們甚至可以將訓練集的代價函式變為0。但此時,會產生過度擬合現象,使其無法generalize 泛化 到新的樣本中。此時,我們就需要正則化。options 1.reduce number of features 2.regula...

Andrew機器學習課程 章節2 單變數線性回歸

在surpervised question中 x,y 表示乙個訓練樣本。x為features 特徵 y為target 目標 xi,yi 表示訓練集。上標i just an index into the training set hypothesis function h x 0 1x.hypothe...

2190610 吳恩達機器學習 章節1

回歸問題 回歸分析是一種數學模型。當因變數和自變數為線性關係時,它是一種特殊的線性模型 一般來說,回歸分析是通過規定因變數和自變數來確定變數之間的因果關係,建立回歸模型,並根據實測資料來求解模型的各個引數,然後評價回歸模型是否能夠很好的擬合實測資料 如果能夠很好的擬合,則可以根據自變數作進一步 其實...