python中sklearn的pipeline模組

最近在看《深度學習：基於keras的python實踐（魏貞原）》這本書，書中8.3建立了乙個scikit-learn的pipeline，首先標準化資料集，然後建立和評估基線神經網路模型，**如下：

# 資料正態化，改進演算法
steps =
('standardize'
, standardscaler())
)('mlp'
, model)
)pipeline = pipeline(steps)
kfold = kfold(n_splits=
10, shuffle=
true
, random_state=seed)
results = cross_val_score(pipeline, x, y, cv=kfold)
print
('standardize: %.2f (%.2f) mse'
%(results.mean(
), results.std())
)

而pipeline是什麼來的呢？

轉換器通常與分類器，回歸器或其他估計器組合在一起，以構建復合估計器。最常用的工具是pipeline。pipeline通常與featureunion結合使用，featureunion將轉換器的輸出連線到乙個復合特徵空間中。 transformedtargetregressor處理轉換目標（即對數變換y）。相反，pipelines僅轉換觀察到的資料（x）。

pipeline是使用（key，value）對的列表構建的，其中key是包含要提供此步驟名稱的字串，而value是乙個估計器物件：

函式make_pipeline是構建pipelines的簡寫;它接受不同數量的估計器，並返回乙個pipeline。它不需要也不允許命名估計器。而是將其名稱自動設定為其型別的小寫字母：

Python中sklearn版本的公升級

呼叫sklearn的impute時，發現sklearn中沒有impute的模組。from sklearn.impute import imputer報錯 modulenotfounderror no module named sklearn.impute 經過檢查，發現anaconda中的sklea...

Python安裝sklearn的問題

我使用的安裝源為，推薦使用豆瓣源，挺全的，不過有的可能沒有，我目前需要的基本都能找到所以總的命令為 pip install i numpy 記住url 後要有空格，然後再輸入numpy 這樣numpy總算順利安裝好了，不過其他小夥伴如果能用pip install numpy方法直接成功安裝的，就不...

sklearn 中的 Pipeline 機制

管道機制在機器學習演算法中得以應用的根源在於，引數集在新資料集比如測試集上的重複使用。管道機制實現了對全部步驟的流式化封裝和管理 streaming workflows with pipelines 注意管道機制更像是程式設計技巧的創新，而非演算法的創新。接下來我們以乙個具體的例子來演示sk...

python中sklearn的pipeline模組

Python中sklearn版本的公升級

Python安裝sklearn的問題

sklearn 中的 Pipeline 機制

相關推薦