機器學習異常值檢測

在生產生活中，由於裝置的誤差或者人為操作失當，產品難免會出現錯誤。然後檢查錯誤對人來說又是乙個十分瑣碎的事情。利用機器學習進行異常值檢測可以讓人類擺脫檢錯的煩惱。

\[ = \sum\limits_^m }

\]\[ = \sum\limits_^m } -

\]\[p(x) = \prod \limits_^n ;,\sigma_j^2)}

\]異常檢測演算法是乙個非監督學習演算法，意味著我們無法通過結果變數判斷我們的資料是否異常。所以我們需要另一種方法檢測演算法是否有效。當我們開發乙個系統時，我們從有標籤（知道是否異常）的資料入手，從中找出一部分正常資料作為訓練集，剩餘的正常資料和異常資料作為交叉檢驗集和測試集。

具體評價方法如下：

異常檢測

監督學習

大量的正常值（y=0）和少量的異常值(y=1)

大量的正向類（y=0）和少量的負向類(y=1)

異常資料太少，只能根據少量資料進行訓練

有足夠多的正向和負向資料以供訓練

舉例：1.欺詐行為檢測；2.生產廢品檢測；3.檢測機器執行狀態

舉例：1.郵箱過濾器；2.天氣預報；3.腫瘤分類

在誤差分析中，如果我們可以發現我的選定的變數是否合適，進而進行相應的改正。如左圖所示，異常點\(x\)對應的概率很高，顯然這種分布方式不能很好地識別出異常值。所以我們嘗試增加變數或者改變變數的型別來識別異常值。如右圖所示，通過增加乙個變數，我們能夠更好地識別異常點。所以，誤差分析對於乙個問題來說還是很重要的。

機器學習異常值檢測

異常值檢測（Outlier Detection）

R中異常值檢測

常用異常值檢測方法

機器學習 異常值檢測

異常值檢測（Outlier Detection）

R中異常值檢測

常用異常值檢測方法

相關推薦

機器學習異常值檢測