《模式識別與智慧型計算》的資料集

2021-10-02 02:48:04 字數 1062 閱讀 2673

這本書我老師說很好,讓我買來看看,結果一學期過去了,emmmm,不是我的問題,是這本書沒有資料,沒有源**(強行甩鍋),咳咳,跑遠了,這本書的資料集我我到網上看到了,它的資料集格式是這樣的

allsamples有兩個字段,乙個為num,乙個feature,然後feature是乙個25*5維的資料,25表示特徵個數,5表示該類字型的個數。由於考慮到可能大多數買了書沒有資料集的問題,我後面寫的**都會用sklearn.dataset下的digits手寫資料集,它是8x8維的矩陣表示乙個數字,有1797個樣本資料,比自己寫好多了。下面是digits的形式

屬性意義

data

資料集target

資料型別

target_name

資料型別名稱

好了,後面寫到的**都會用到這個**,其他的資料型別,有需要的自行檢視,這裡就不解釋了。

from sklearn import datasets

import numpy as np

#匯入資料

digits = datasets.load_digits(

)#檢視第一資料的樣子

new_im = np.reshape(digits.data[0]

,(8,

8))print

("第乙個數字是"

,digits.target[0]

)print

(new_im)

執行結果如下:

後面的內容都會用以上資料集,如果有錯誤請指出,互相學習*(▽)*

模式識別與智慧型計算第一節(模式識別概述)

1 模式識別系統 資料獲取 用計算機語言 可計算數字符號 來表示研究物件 預處理 對研究物件去雜訊,復原等 特徵提取與選擇 對資料進行變換,降緯,簡化處理等 分類決策 歸類 分類器設計 對分類結果進行判斷檢測,誤差分析 2 模式識別主要問題 特徵選擇與優化 特徵選擇 使同類物體緊緻性 組合優化 對映...

《模式識別與智慧型計算》感知機模型

感知機模型 按照統計學三要素來寫的話 模型 符號函式 策略 損失函式 誤點到超平面的距離之和 演算法 利用梯度下降演算法進行求解 感知機原理 感知機模型用來線性判別資料集,什麼意思呢就是用一超平面來隔斷兩個不同的類別,超平面在二維的資料集中就是一條直線,在三維的資料集中就是乙個平面,假設有n維的資料...

《模式識別與智慧型計算》夾角余弦距離分類

演算法流程 計算待測樣品與訓練集裡每個樣品x的角度距離 角度距離最大的就是所屬的樣品類別 演算法實現 計算夾角余弦 def anglecos x train,y train,sample function 按照夾角余弦距離法計算待測樣品與樣品庫中的相似度 param x train 訓練集 m n ...