PCA降維後出現準確率低的問題的一種解決方法經驗

2021-10-03 06:39:42 字數 446 閱讀 2609

使用mnist資料集,以linearsvc作為分類器,練習pca降維。

用mnist提供的所有訓練資料訓練分類器後,使用mnist提供的測試集,準確率達到0.83。

但是在pca降維,並取80%的特徵後,準確率僅僅0.26。

究其原因,我首先將訓練集pca至80%特徵(149維),為了使用linearsvc的predict()函式,我又用pca將測試集資料降至149維。

在上一段就出現了錯誤: 兩個資料集分別經過pca降維之後,已經成為完全不同的資料——我還未考慮其中的數學原理,但就實驗結果來看,必須要將所有資料放在一起降維,然後再使用sklearn 中的train_test_split()劃分訓練與測試集。此時,準確率達到了0.9。

但是這個結果也很奇怪——它(56,000)高於使用所有訓練集(60,000)的準確率。

可能因為去除了雜訊?我還沒有花時間去想。

謝謝!

opencv自帶的PCA降維應用(一)

好啦,下面進入正題 首先在降維之前我提取的vlad特徵是60 64維的,即3840維,我的庫有5063張,所以降維前我的庫的vlad特徵是5063 3840,我們給他取個名,叫vlad all,是5063行,3840列哦,行和列不要弄混了,我想把3840維的特徵降為128維,也就是減少30倍,最終使...

一道關於診斷準確率的概率題

題目如下 這是一道關於診斷準確率的題,首先明白,萬分之一只是長期統計得到的得病率,不是針對這一次診斷的,那麼這次a得病的概率應該是多少呢?首先來計算被診斷為得病的概率。因為存在誤報和準報,而不存在漏報,即一旦得病一定能檢查到,所以診斷為得病的概率應該分為兩部分 p 得病且準確報告 p 沒得病但被誤報...

搜尋 一種改進的召回率準確率公式計算方式

在資訊檢索系統中,召回率和準確率的定義為 召回率 recall ratio,簡稱r 是衡量資訊檢索系統在實施某一檢索作業時檢出相關文獻能力的一種測度指標,其計算方法為 recall 檢出的相關文獻量 檢索系統中的相關文獻總量.準確率 precision ratio,簡稱p 是衡量系統在實施某一檢索作...