機器學習模組總結

sklearn 是基於python的機器學習工具模組。裡面主要包含了6大模組：分類、回歸、聚類、降維、模型選擇、預處理。

根據sklearn 官方文件資料，下面將各個模組中常用的模型函式總結出來。

1. 回歸及分類（監督學習）

1.1 廣義線性模型 (fromsklearn import linear_model)

最小二乘法：擬合乙個線性模型, 使得資料集實際觀測資料和**資料（估計值）之間殘差平方和最小。

clf=linear_model.linearregression(), clf.fit(x,y)

嶺回歸：改良的最小二乘，解決共線問題。

clf=linear_model.ridge(alpha=0.5)，clf.fit(x,y)

邏輯回歸：

clf=linear_model.logisticregression()

1.2 樸素貝葉斯

高斯模型: from sklearn.*****_bayes import gassiannb

gnb=gassiannb(),gnb.fit(data, target).predict(data)

多項式模型：multinomialnb

伯努利模型：會把輸入資料二元化bernoullinb

1.3 決策樹 from sklearn import tree

決策樹分類器：clf=tree.decisiontreeclassifier()

回歸分類器（y 值為float非int）：

clf=tree. decisiontreeregressor()

1.4 支援向量機

from sklearn import svm

clf=svm.svc()

2. 聚類

k-means:

from sklearn.cluster import kmeans

kmeans= kmeans(n_clusters=2, random_state=0).fit(x)

3. 降維

pca:

from sklearn.decomposition import pca

pca = pca(n_components=2)

method:

fit(x[y])

get_covariance()

get_params([deep])

get_precision()

score(x[y])

4. 特徵選擇

樹特徵：

from sklearn.ensemble import extratreesclassifier

5 .資料預處理

from sklearn import preprocessing

標準化：preprocessing.scale(x)

規範化：preprocessing.normalize()

二值化: preprocessing.binarizer()

處理缺失值：fromsklearn.preprocessing import imputer

imp=imputer(missing_values='nan',strategy='mean',axis=0)

機器學習總結

1.常用的機器學習演算法包括監督學習半監督學習無監督學習增強學習遺傳演算法監督學習就是人為的設定規則，告訴機械人該執行怎麼樣的行動。無監督學習就是不告訴機械人具體的實施辦法，只給定規則，讓機械人過程當中自己學習總結經驗半監督學習就是結合少標籤的樣本和大量無標籤的樣本進行學習和分類強...

機器學習總結

0機器學習概述什麼是機器學習？機器學習的分類兩種分類方式。機器學習的一般流程模型訓練中的交叉驗證將資料分為幾份，每份第一次訓練做訓練集，第二次做了測試集機器學習的評價混淆矩陣 auc roc 一線性回歸解析解的求解過程，要求自己推導目標函式，過擬合，正則式模型效果 mse rms...

機器學習總結

傳統的機器學習大致分為線性回歸邏輯回歸決策樹支援向量機神經網路等深度學習以神經網路的回歸為基礎，之後會談到的大致有卷積神經網路遞迴神經網路這段時間學習以來，很直觀的體會到，機器學習的本質就是再用計算力和合適的演算法來你想要的東西，比如房價問題，分類問題等。假設你的算力足夠強大，...

機器學習模組總結

機器學習總結

機器學習總結

機器學習總結

相關推薦