機器學習03 K值的選擇

2021-09-20 06:27:03 字數 431 閱讀 3087

k值過小:

​ 容易受到異常點的影響

k值的減小就意味著整體模型變得複雜,容易發生過擬合;

eg:判斷是不是人?

眼睛,鼻子,黃**

**顏色為過擬合

k值過大:

​ 受到樣本均衡的問題

與輸入例項較遠(不相似的)訓練例項也會對**器作用,使**發生錯誤,且k值的增大就意味著整體的模型變得簡單。

eg:判斷是不是人?

特徵值:眼睛,鼻子

?呢?如何選擇k值?

近似誤差:對現有訓練集的訓練誤差,關注訓練集,如果近似誤差過小可能會出現過擬合的現象,對現有的訓練集能有很好的**,但是對未知的測試樣本將會出現較大偏差的**。模型本身不是最接近最佳模型。

估計誤差:可以理解為對測試集的測試誤差,關注測試集,估計誤差**明對未知資料的**能力好,模型本身最接近最佳模型。

機器學習 K means如何選擇k值?

k means聚類是我們在無監督學習中常用的一種演算法,但有乙個很讓人頭疼的問題就是如何選擇k值。在實際業務中,如果根據業務場景明確知道要得到的類數,那就好辦了,但很多時候不知道k怎麼辦呢?下面有三種方法可以用來確定k值,其基本思想還是最小化類內距離,最大化類間距離,使同一簇內樣本盡可能相似,不同簇...

機器學習演算法 1 4 k值的選擇

舉例說明 k值過大 k值選擇問題,李航博士的一書 統計學習方法 上所說 選擇較小的k值,就相當於用較小的領域中的訓練例項進行 學習 近似誤差會減小,只有與輸入例項較近或相似的訓練例項才會對 結果起作用,與此同時帶來的問題是 學習 的估計誤差會增大,換句話說,k值的減小就意味著整體模型變得複雜,容易發...

k值的選擇

k值過大 k值選擇問題,李航博士的一書 統計學習方法 上所說 1 選擇較小的k值,就相當於用較小的領域中的訓練例項進行 學習 近似誤差會減小,只有與輸入例項較近或相似的訓練例項才會對 結果起作用,與此同時帶來的問題是 學習 的估計誤差會增大,換句話說,k值的減小就意味著整體模型變得複雜,容易發生過擬...