kNN高階例項

這裡我們用knn來分類乙個大點的資料庫，包括資料維度比較大和樣本數比較多的資料庫。這裡我們用到乙個手寫數字的資料庫,這個資料庫包括數字0-9的手寫體。每個數字大約有200個樣本。每個樣本保持在乙個txt檔案中。手寫體影象本身的大小是32x32的二值圖，轉換到txt檔案儲存後，內容也是32x32個數字，0或者1，如下：

資料庫解壓後有兩個目錄：目錄trainingdigits存放的是大約2000個訓練資料，testdigits存放大約900個測試資料。

這裡我們還是新建乙個knn.py指令碼檔案，檔案裡面包含四個函式，乙個用來生成將每個樣本的txt檔案轉換為對應的乙個向量，乙個用來載入整個資料庫，乙個實現knn分類演算法。最後就是實現這個載入，測試的函式。

最後在knn.py所在的目錄下開啟終端，

import knn

knn.testhandwritingclass()

看到最後的輸出結果：

>>> import knn

>>> knn.testhandwritingclass()

step 1: load data...

---getting training set...

---getting testing set...

step 2: training...

step 3: testing...

step 4: show the result...

the classify accuracy is: 98.76%

>>>

kNN高階例項

演算法修煉 KNN（微高階）

KNN 演算法的例項應用

機器學習中的kNN及其Python例項

kNN高階例項

演算法修煉 KNN（微高階）

KNN 演算法的例項應用

機器學習中的kNN及其Python例項

相關推薦