sklearn第二十七講 模型永續性

2021-08-22 14:51:37 字數 607 閱讀 3536

在訓練了乙個scikit-learn模型後,如果想持久化這個模型以便將來使用怎麼辦呢?下面以乙個例子介紹怎樣使用pickle持久化乙個模型。

使用python內建的持久化模型pickle, 能夠在scikit裡儲存乙個模型。

在特定的情況下,可以使用pickle的joblib替代(joblib.dump & joblib.load),它對於載入大numpy陣列的物件的執行效率更高。

from sklearn.externals import joblib

joblib.dump(clf, 'filename.pkl')

以後,你可以在另乙個python程序載入回這個pickle模型

clf = joblib.load('filename.pkl')
pickle在安全性與可維護性方面有一些問題。

為了在未來版本的scikit-learn重建乙個類似的模型,額外的元資料(metadata)也應該被儲存。

第二十七周總結

最近一周一直在小組複習,主要複習電路和高數,現在對擔心的還是電路,感覺複習的還不夠紮實。下周一就要考電路了,希望不會掛科。本週偶爾晚飯時間去打打籃球,剩餘時間基本上都在小組緊張的複習,下學期一定在日常學習中查漏補缺,不會在最後複習的時候才發現不會的地方有那麼多。參加了三下鄉的面試,感覺發揮得還可以,...

第二十七天

今天主要學習了linux的程序通訊 程序通訊可分為 管道通訊 訊號通訊 共享記憶體和訊息佇列 管道通訊 分無名管道和有名管道,無名管道一般用於父子程序之間 訊號通訊的產生方式 1.按鍵產生 2.硬體異常產生 除數為0,無效儲存訪問等 3.程序用kill函式給另乙個程序發訊號 4.使用者用kill命令...

2018 9 12第二十七次筆記

cisc和risc的區別 1.cisc是複雜指令集cpu,這裡所說的複雜和簡單是針對設計者而言的,這種體系的設計理念是用最少的指令來完成任務。複雜就體現在cisc的cpu本身設計複雜 工藝複雜,但好處是編譯器好設計,早期的intel一直採用cisc的體系。這種cisc有乙個最致命的缺點就是功耗大!2...