關於sklearn,監督學習幾種模型的對比

2022-07-04 02:36:14 字數 879 閱讀 6573

# k近鄰,適用於小型資料集,是很好的基準模型,容易解釋

from sklearn.neighbors import kneighborsclassifier

# 線性模型,非常可靠的首選演算法,適用於很大的資料集,也適用於高維資料

from sklearn.linear_model import linearregression

# 樸素貝葉斯,只適用於分類問題,比線性模型速度還快,適用於非常大的資料集和高維資料,但精度通常低於線性模型

from sklearn.linear_model import bayesianridge

# 決策樹,速度很快,不需要資料縮放,可以視覺化,很容易解釋

from sklearn.tree import decisiontreeclassifier

# 隨機森林,幾乎總是比單個決策樹的表現要好,魯棒性很好,非常強大。不需要資料縮放,不適用於高維稀疏矩陣

from sklearn.ensemble import randomforestclassifier

# 梯度提公升決策樹,精度通常比隨機森林略高,與隨機森林相比,訓練速度更慢,但是**速度更快,需要的記憶體也少,比隨機森林需要更多的引數調節

from sklearn.ensemble import gradientboostingclassifier

# 支援向量機,對於特徵含義相似的中等大小的資料集很強大,需要資料縮放,對引數敏感

from sklearn.svm import svc

# 神經網路,可以構建非常複雜的模型,特別是對於大型資料而言。對資料縮放敏感,對引數選取敏感,大型網路需要很長的訓練時間

from sklearn.neural_network import mlpclassifier

監督學習和無監督學習 監督學習與非監督學習

監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...

監督學習,無監督學習和半監督學習

監督學習 supervised learning 無監督學習 unsupervised learning 半監督學習 semi supervised learning 2 概念 監督學習 用一部分已知分類 有標記的樣本來訓練機器後,讓它用學到的特徵,對沒有還分類 無標記的樣本進行分類 貼標籤。一句話...

監督學習 非監督學習 半監督學習(主動學習)

統計學習通常包括監督學習 非監督學習 半監督學習以及強化學習,在機器學習的領域中前三種研究的比較多的,也是運用的比較廣泛的技術。監督學習的任務是學習乙個模型,使模型對給定的任意的乙個輸入,對其都可以對映出乙個 結果。這裡模型就相當於我們數學中乙個函式,輸入就相當於我們數學中的x,而 的結果就相當於數...