kaggle之手寫體識別

2022-07-31 18:18:12 字數 4085 閱讀 1027

kaggle位址

首先載入資料集

import pandas as pd

import numpy as np

train = pd.read_csv('/users/frank/documents/workspace/kaggle/dataset/digit_recognizer/train.csv')

test = pd.read_csv('/users/frank/documents/workspace/kaggle/dataset/digit_recognizer/test.csv')

print train.head()

print test.head()

label  pixel0  pixel1  pixel2  pixel3  pixel4  pixel5  pixel6  pixel7  \

0 1 0 0 0 0 0 0 0 0

1 0 0 0 0 0 0 0 0 0

2 1 0 0 0 0 0 0 0 0

3 4 0 0 0 0 0 0 0 0

4 0 0 0 0 0 0 0 0 0

pixel8 ... pixel774 pixel775 pixel776 pixel777 pixel778 \

0 0 ... 0 0 0 0 0

1 0 ... 0 0 0 0 0

2 0 ... 0 0 0 0 0

3 0 ... 0 0 0 0 0

4 0 ... 0 0 0 0 0

pixel779 pixel780 pixel781 pixel782 pixel783

0 0 0 0 0 0

1 0 0 0 0 0

2 0 0 0 0 0

3 0 0 0 0 0

4 0 0 0 0 0

[5 rows x 785 columns]

pixel0 pixel1 pixel2 pixel3 pixel4 pixel5 pixel6 pixel7 pixel8 \

0 0 0 0 0 0 0 0 0 0

1 0 0 0 0 0 0 0 0 0

2 0 0 0 0 0 0 0 0 0

3 0 0 0 0 0 0 0 0 0

4 0 0 0 0 0 0 0 0 0

pixel9 ... pixel774 pixel775 pixel776 pixel777 pixel778 \

0 0 ... 0 0 0 0 0

1 0 ... 0 0 0 0 0

2 0 ... 0 0 0 0 0

3 0 ... 0 0 0 0 0

4 0 ... 0 0 0 0 0

pixel779 pixel780 pixel781 pixel782 pixel783

0 0 0 0 0 0

1 0 0 0 0 0

2 0 0 0 0 0

3 0 0 0 0 0

4 0 0 0 0 0

[5 rows x 784 columns]

分離訓練資料和標籤:

train_data = train.values[:,1:]

label = train.ix[:,0]

test_data = test.values

使用pca來降維:pca文件

使用svm來訓練:svm文件

from sklearn.decomposition import pca

from sklearn.svm import svc

pca = pca(n_components=0.8, whiten=true)

# pca.fit(train_data)

train_data = pca.fit_transform(train_data)

# pca.fit(test_data)

test_data = pca.transform(test_data)

print('使用svm進行訓練...')

svc = svc(kernel='rbf',c=2)

svc.fit(train_data, label)

print('訓練結束.')

使用svm進行訓練...

訓練結束.

print('對測試集進行**...')

predict = svc.predict(test_data)

print('**結束.')

對測試集進行**...

**結束.

儲存結果:

pd.dataframe(

).to_csv('output.csv', index=false, header=true)

print 'done.'

done.

kaggle練習 手寫體識別

coding utf 8 created on sun apr 22 10 25 14 2018 author zhangsh import csv import numpy as np from sklearn.neighbors import kneighborsclassifier list ...

tensorflow 之手寫體識別

原因 由於tensorflow相對於caffe更加靈活,準備轉戰tensorflow,昨天看了下大概的基本函式,今天打算先跑跑簡單的例子 tensorflow的安裝太簡單了,一行 搞定,網上很多教程,不一一列出。想安裝固定tensorflow版本 pip install tensorflow gpu...

Matlab深度學習實踐之手寫體識別(含詳細注釋)

matlab這幾年在人工智慧這塊兒也越做越好了,最近為了熟悉matlab如何搭建神經網路,自己做了乙個手寫體識別實驗,記錄一下。實驗任務非常簡單,網路搭的也非常隨意,不合理的地方也懶得改,旨在走通matlab搭建神經網路的流程。首先,資料集為mnist資料集 我已經把資料按類別分好,分為train和...