機器學習筆記1 z score matlab

2021-09-24 19:36:44 字數 847 閱讀 9687

對於乙個向量x,可以利用z-score方法將其標準化為x『,向量x中的每乙個值x轉化為x』的計算公式如下:x』=(x-mean(x))./std(x)

所以,可以理解為z-score 標準化(正太標準化)是基於原始資料的均值(mean)和標準差(standard deviation)進行資料的標準化。

>> a=[1,2,3]

a = 1 2 3

>> b=zscore(a)

b = -1 0 1

>>

>> a=[1,2,3;4,5,6]

a = 1 2 3

4 5 6

>> b=zscore(a)

b = -0.7071 -0.7071 -0.7071

0.7071 0.7071 0.7071

>>

>> a=[1,2,3;4,5,6]

a = 1 2 3

4 5 6

>> b=zscore(a, 0, 2)

b = -1 0 1

-1 0 1

dim引數:

可通過zscore將兩組或多組資料轉化為無單位的zscore分值,使得資料標準統一化。若轉換後,某些數值較大,則表明偏離均值較遠,則可捨去這幾組資料。

參考部落格:

資料標準化方法z-score講解(matlab)

3.4.2資料標準化(一) - z-score標準化

機器學習筆記 1

1 機器學習的定義 如果乙個程式可以在任務t上,隨經驗e的增加,效果p隨之增加,則這個程式可以從經驗中學習。過程 單個神經元 2 基於tensorflow的nn 神經網路 用張量表示資料,用計算圖搭建神經網路,用會話執行,優化線上的權重 引數 得到模型。2.1 張量 多維陣列 列表 階 表示張量的維...

機器學習筆記1

高斯分布屬於指數分布族,線性最小二乘就是基於高斯分布。線性最小二乘 最大似然 最小二乘。高斯判別分析 gda 針對的是特徵向量 x 為連續值時的問題,而樸素貝葉斯 nb 針對的是特徵向量 x 為離散值時的問題。gda 比 logistic 回歸有更嚴格的前置假設。當資料服從或大致服從正態分佈時,使用...

機器學習筆記(1)

機器學習筆記。1 經驗誤差與過擬合 2 評估方法 測試集與訓練集互斥 2.1 留出法 資料集劃分為兩個互斥集,乙個用作訓練,乙個用作測試。注意資料分布一致性?分層取樣 正反例比例一致 由於按比例分割可能存在樣本次序的關係,正例 反例的具體化為可能影響結果的分析 需要進行多次隨機劃分,重複實驗取平均值...