小白機器學習速通教程 演算法入門

2021-10-17 08:42:21 字數 2380 閱讀 2479

往期文章:

小白機器學習速通實用教程1

**實現:

from sklearn.datasets import load_iris,fetch_20newsgroups

li = load_iris (

)print

( li.data )

print

( li.feature_names )

print

(li.target_names)

輸出:

用來訓練模型的資料與用來評估的資料不能是同乙個資料,否則是用自己證明自己,所以需要把資料劃分為兩類,一類為訓練集(用於構建模型),一類為測試集(用於估計模型)

經過實驗,比較好的資料比例是 訓練集:測試集為75:25

**實現:

x_train , x_test , y_train , y_test = train_test_split ( li.data , li.target , test_size=

0.25

)#x_train為訓練集特徵值,y_train為訓練集目標值。x_test為測試集特徵值,y_test為測試集目標值

定義:如果乙個樣本在特徵空間中的k個最相似(即特徵空間中最臨近)的樣本中的大多數屬於某乙個類別,則該樣本也屬於這個類別

假單理解:根據測試的特徵值,跟哪個值最近,就判斷他的目標值是哪個

4.**實現:

li = load_iris (

) x_train , x_test , y_train , y_test = train_test_split ( li.data , li.target , test_size=

0.25

) stand = standardscaler (

) x_test = stand.fit_transform ( x_test )

x_train = stand.transform ( x_train )

knn = kneighborsclassifier (n_neighbors =3)

knn.fit ( x_train , y_train )

y_predict = knn.predict ( x_test )

print

('**值為:'

, y_predict )

print

('實際值為:'

, y_test )

print

('準確率:'

, knn.score ( x_test , y_test )

)

4.使用場景:小資料場合,幾千到幾萬的樣本

含有概率論的思想,這裡介紹一下有關內容

**實現:幾乎與k臨近演算法相似,只是換了standardscarler為multinomialnb

nws = fetch_20newsgroups ( subset =

'all'

)# 資料分割:

x_train , x_test , y_train , y_test = train_test_split ( nws.data , nws.target , test_size =

0.25

)# 進行特徵抽取

tf = tfidfvectorizer (

)x_train = tf.fit_transform ( x_train )

# 測試集統計的就是訓練集的標準,所以用transform,保證標準統一,就是特徵詞的列表由訓練集產生

x_test = tf.transform ( x_test )

#輸出特徵列表,有哪些特徵,由於是文章,所以特別多

print

( tf.get_feature_names ())

mlt = multinomialnb(alpha =

1.0)

print

( x_train.toarray ())

mlt.fit ( x_train , y_train )

y_predict = mlt.predict ( x_test )

print

(,y_train)

print

(, y_predict )

print

('準確率:'

, mlt.score ( x_test , y_test )

)

輸出:

往期文章:小白機器學習速通實用教程1

總結 從小白到機器學習入門

2017年是進步比較快的一年,學到了很多東西,找到了自己喜歡的方向,朝著方向不斷努力 第一次接觸到人工智慧,機器學習領域,有導師帶著做專案,參賽,實習,繼續自我提公升。第一次接觸到人工智慧領域是在3月份,選了人工智慧這門課,算是半個科班生吧,教材比較枯燥,老師講得也比較單調,上到後面基本上就只有幾個...

Python機器學習入門教程

如果你對機器學習感興趣,甚至是想從事相關職業,那麼這本書非常適合作為你的第一本機器學習資料。市面上大部分的機器學習書籍要麼是告訴你如何推導模型公式要麼就是如何 實現模型演算法,這對於零基礎的新手來說,閱讀起來相當困難。而這本書,在介紹必要的基礎概念後,著重從如何呼叫機器學習演算法解決實際問題入手,一...

機器學習入門 常見演算法

乙個故事說明什麼是機器學習 機器學習這個詞是讓人疑惑的,首先它是英文名稱machine learning 簡稱ml 的直譯,在計算界machine一般指計算機。這個名字使用了擬人的手法,說明了這門技術是讓機器 學習 的技術。但是計算機是死的,怎麼可能像人類一樣 學習 呢?關於機器學習的詳細內容 機器...