8 噪音和錯誤

2021-07-03 03:46:07 字數 1424 閱讀 2798

當我們面對的問題不是完美的(無噪音)二值分類問題,vc 理論還有效嗎?

1,噪音和非確定性目標

幾種錯誤:(1) noise in y: mislabeled data; (2) noise in y: different labels for same x; (3) noise in x: error x.

將包含噪音的y 看作是概率分布的,y ~ p(y|x)。

學習的目標變為**最有可能出現的y,max 。

2, 錯誤的測量 (error measure)

對錯誤不同的測量方法將對學習過程有不同的指導。

如下面的0/1 error 和 squared error.

我們在學習之前,需要告訴模型我們所關心的指標或衡量錯誤的方法。

3,衡量方法的選擇

圖中的false accept 和 false reject 就是我們在分類中常說的 false positive 和 false negative,只是台灣和大陸的叫法不同而已。

採用0/1 error 時,對於每種錯誤,都會有相同程度的懲罰(panalize)。

然而,在實際應用中,兩種錯誤帶來的影響可能很不一樣。

例如(講義中的例子),乙個商場對顧客進行分類,老顧客可以拿到折扣,新顧客沒有折扣;這時,如果發生false reject(將老顧客錯分為新顧客)而不給其打折,那麼會嚴重影響使用者體驗,對商家口碑造成損失,影響較壞;而如果發生false accept (將新顧客錯分為老顧客)而給其打折,也沒什麼大不了的。

另乙個例子,cia 的安全系統身份驗證,如果發生false accept(將入侵者錯分為合法雇員),後果非常嚴重。

4,帶權重的分類

依然是借助cia 身份驗證的例子來說明什麼是weighted classification:

通過感知機模型解決cia 分類問題。如果資料時線性可分的,那麼帶權重與否對結果沒有影響,我們總能得到理想結果。

如果輸入資料有噪音(線性不可分),像前面學習感知機時一樣,採用pocket 方法,然而計算錯誤時對待兩種錯誤(false reject/false accept) 不再一視同仁,false acceot 比false reject 嚴重1000倍。通過下面方法解決:

即,在訓練開始前,我們將 的資料複製1000倍之後再開始學習,後面的步驟與傳統的pocket 方法一模一樣。

然而,從效率、計算資源的角度考慮,通常不會真的將y=-1 的資料拷貝1000倍,實際中一般採用"virtual copying"。只要保證:

randomly check -1 example mistakes with 1000 times more probability.

(這句大家還是看英文比較好,以免理解有歧義)

總之,我們選擇好適合特定應用的error measure: err,然後在訓練時力求最小化err,即,我們要讓最後的**發生錯誤的可能性最小(錯誤測量值最小),這樣的學習是有效的。

8 錯誤和異常

語法錯誤也就是解析錯誤.test.py while true print ss 執行結果 file main.py line 1 while true syntaxerror invalid syntax repl closed 當語法沒有錯誤後還會引發其他的錯誤,例如除數是0的時候,會丟擲zero...

噪音聲壓和聲功率的區別 電機噪音檢測方式和安裝方式

電機運轉時,產生的噪音有三個方面,一是電磁噪音,二是機械噪音,三是通風雜訊。1 電磁雜訊。主要是有氣隙諧波磁場引起的,定轉子齒諧波磁通相互作用而產生的徑向交變磁拉力,會引起定子鐵芯軛部產生週期性的動態徑向變形,激發定子產生電磁雜訊。另外,鼠籠轉子斷條 繞線轉子匝間短路 轉子偏心 定子繞組不對稱或匝間...

python官方文件 8錯誤和異常

這只是乙個簡要的個人回顧,慎看 錯誤和異常 1.語法錯誤 2.異常 在語法上正確,但執行時可能引發錯誤。常見exception zerodivisioneroor nameerror typeerror 3.異常處理 try catch else finally 沒有 獲到的異常會傳到上一級去han...