交叉驗證法

基本原理

交叉驗證是用來觀察模型的穩定性的一種方法，我們將資料劃分為n份，依次使用其中乙份作為測試集，其他n-1份作為訓練集，多次計算模型的精確性來評估模型的平均準確程度。訓練集和測試集的劃分會干擾模型的結果，因此用交叉驗證n次的結果求出的平均值，是對模型效果的乙個更好的度量。

實現**及注釋

from sklearn.datasets import load_boston
from sklearn.model_selection import cross_val_score
from sklearn.tree import decisiontreeregressor
# 利用datasets中的波士頓房價資料集。
boston = load_boston(
)# 例項化乙個樹，與分類樹類似。
regressor = decisiontreeregressor(random_state=0)
# 進行交叉驗證。
# regressor模型評估器，可以是任何例項化過後的演算法模型。
# boston.data資料集，不需要劃分訓練集與測試集，完整的資料集。
# boston_target 標籤集
# cv = 10 交叉驗證十次，通常為5 ，預設為5
# scoring返回衡量模型的結果，預設為r平方，neg_mean_squared_error為負均方誤差
result = cross_val_score(regressor,
boston.data,
boston.target,
cv=10,
scoring =
"neg_mean_squared_error"
)print
("交叉驗證結果(負均方誤差)："
,result)

結果展示

雖然均方誤差永遠為正，但是sklearn當中使用均方誤差作為評判標準時，卻是計算」負均方誤差「（neg_mean_squared_error）。這是因為sklearn在計算模型評估指標的時候，會考慮指標本身的性質，均方誤差本身是一種誤差，所以被sklearn劃分為模型的一種損失(loss)，因此在sklearn當中，都以負數表示。真正的均方誤差mse的數值，其實就是neg_mean_squared_error去掉負號的數字。

交叉驗證法

林軒田 15 驗證法

通俗易懂徹底理解十倍交叉驗證法

簡述什麼是交叉驗證法統計學簡答題參考1 0

交叉驗證法

林軒田 15 驗證法

通俗易懂徹底理解十倍交叉驗證法

簡述什麼是交叉驗證法 統計學簡答題參考1 0

相關推薦

簡述什麼是交叉驗證法統計學簡答題參考1 0