機器學習和資料分析專案工程化流程

機器學習系統

傳統的軟體工程專案有著非常大的差異

產品經理-開發(前端和後端)-測試-運維

包含通用軟體工程裡那些單元測試，發布流程等內容

資料管理的難度-資料變更，資料是描述事物的，事物發生變化資料需求方--資料開發方-資料運維方-資料使用方數值穩定性

依賴變更推送--

ml和資料系統具有強耦合多了資料依賴問題天然的互動式、實驗性開發方式機器學習pipeline一般會包括

訓練資料的收集，特徵生成，模型訓練，模型驗證，部署和服務發布等環節

良好的工程實踐進行系統抽象從總體上把控**模組結構，才能更好的平衡實驗的靈活性與系統開發效率，保證整體的高效運作精心設計配置項把資料清洗、特徵工程、模型訓練等模組特徵工程特徵工程**寫相應的測試模型：模型說明記錄模型超引數模型優化指標模型時效性模型測試流程：基準測試比較，多版本模型效果推演，不同資料上的表現，模型的包容性測試模型的快速復現：機器學習pipeline的整合測試模型發布和部署：灰度發布的方式模型能夠快速回滾-回滾演練模型效能相關監控

短時間內明顯的指標急劇下降外，同時也要關注長期的緩慢的下降

the ml test score

hidden technical debt in machine learning systems

機器學習和資料分析專案工程化流程

Python與R進行機器學習和資料分析

機器學習基礎資料分析

機器學習開放專案 NBA統計資料分析

機器學習和資料分析專案 工程化流程

Python與R進行機器學習和資料分析

機器學習基礎 資料分析

機器學習開放專案 NBA統計資料分析

相關推薦

機器學習和資料分析專案工程化流程

機器學習基礎資料分析