python中sklearn的pipeline模組

2021-10-06 07:15:11 字數 1626 閱讀 8459

最近在看《深度學習:基於keras的python實踐(魏貞原)》這本書,書中8.3建立了乙個scikit-learn的pipeline,首先標準化資料集,然後建立和評估基線神經網路模型,**如下:

# 資料正態化,改進演算法

steps =

('standardize'

, standardscaler())

)('mlp'

, model)

)pipeline = pipeline(steps)

kfold = kfold(n_splits=

10, shuffle=

true

, random_state=seed)

results = cross_val_score(pipeline, x, y, cv=kfold)

print

('standardize: %.2f (%.2f) mse'

%(results.mean(

), results.std())

)

而pipeline是什麼來的呢?

轉換器通常與分類器,回歸器或其他估計器組合在一起,以構建復合估計器。最常用的工具是pipeline。pipeline通常與featureunion結合使用,featureunion將轉換器的輸出連線到乙個復合特徵空間中。 transformedtargetregressor處理轉換目標(即對數變換y)。相反,pipelines僅轉換觀察到的資料(x)。

pipeline是使用(key,value)對的列表構建的,其中key是包含要提供此步驟名稱的字串,而value是乙個估計器物件:

函式make_pipeline是構建pipelines的簡寫;它接受不同數量的估計器,並返回乙個pipeline。它不需要也不允許命名估計器。而是將其名稱自動設定為其型別的小寫字母:

Python中sklearn版本的公升級

呼叫sklearn的impute時,發現sklearn中沒有impute的模組。from sklearn.impute import imputer報錯 modulenotfounderror no module named sklearn.impute 經過檢查,發現anaconda中的sklea...

Python安裝sklearn的問題

我使用的安裝源為,推薦使用豆瓣源,挺全的,不過有的可能沒有,我目前需要的基本都能找到 所以總的命令為 pip install i numpy 記住url 後要有空格,然後再輸入numpy 這樣numpy總算順利安裝好了,不過其他小夥伴如果能用pip install numpy方法直接成功安裝的,就不...

sklearn 中的 Pipeline 機制

管道機制在機器學習 演算法中得以應用的根源在於,引數集在新資料集 比如測試集 上的重複使用。管道機制實現了對全部步驟的流式化封裝和管理 streaming workflows with pipelines 注意 管道機制更像是程式設計技巧的創新,而非演算法的創新。接下來我們以乙個具體的例子來演示sk...