達觀杯文字處理（三）調優與融合

【task4 模型優化】：（2天）

1）進一步通過網格搜尋法對3個模型進行調優（用5000條資料，調參時採用五折交叉驗證的方式），並進行模型評估，展示**的執行結果。(可以嘗試使用其他模型)

2）模型融合，模型融合方式任意，並結合之前的任務給出你的最優結果。

例如stacking融合，用你目前評分最高的模型作為基準模型，和其他模型進行stacking融合，得到最終模型及評分結果。

結果展示如下表：

grid search：一種調參手段；窮舉搜尋：在所有候選的引數選擇中，通過迴圈遍歷，嘗試每一種可能性，表現最好的引數就是最終的結果。其原理就像是在陣列裡找最大值。（為什麼叫網格搜尋？以有兩個引數的模型為例，引數a有3種可能，引數b有4種可能，把所有可能性列出來，可以表示成乙個3*4的**，其中每個cell就是乙個網格，迴圈過程就像是在每個網格裡遍歷、搜尋，所以叫grid search）

gridsearchcv & cross_val_score 思考

gridsearchcv（網格搜尋）用簡答的話來說就是你手動的給出乙個模型中你想要改動的所用的引數，程式自動的幫你使用窮舉法來將所用的引數都執行一遍。

cross_val_score 一般用於獲取每折的交叉驗證的得分，然後根據這個得分為模型選擇合適的超引數，通常需要編寫迴圈手動完成交叉驗證過程；

gridsearchcv 除了自行完成叉驗證外，還返回了最優的超引數及對應的最優模型

code_模型調參

參考:---------------------

參考鏈結及學習資料：

datawhale-達觀杯nlp覆盤

達觀杯文字處理（三）調優與融合

達觀杯文字處理任務

文字處理與統計

SHELL與文字處理

達觀杯文字處理（三） 調優與融合

達觀杯文字處理任務

文字處理與統計

SHELL與文字處理

相關推薦

達觀杯文字處理（三）調優與融合