讀後感微軟首席資料科學家謝樑的AI故事

csdn：你的著作《keras 快速上手：基於 python 的深度學習實戰》，選擇從 keras 入手簡單、快速地設計模型，較少注底層**，那我們是否可以這麼推導：現在很多演算法都封裝好了，並且工業界應用的模型那麼多，安心當調包俠就可以了？

謝樑：肯定不是這樣的。誠然，現在的機器學習理論和演算法越來越先進，很多以前需要資料科學家和分析師進行的工作都可以由演算法自動完成，比如以前需要做很多人工的特徵工程工作，現在新的演算法將這方面的要求降低，但是如何選擇合適的模型，如何對結果進行合理的解釋仍然需要資料科學家有較好的理論訓練和知識深度。

在工業界應用機器學習，包括三個部分：

現在有了較多可呼叫的機器學習包，只是讓中段的一些工作簡化，但同時對前端和末端提出了更多的要求，因為現在很多業務問題都非常複雜，如何將其合理地分解為可以進行建模的問題，非常考驗實踐工作者。同時，如何將分析結果植入到現有生產系統中，高效率高質量地執行也是不低的要求。

「調包俠」會是被人工智慧代替的首批白領之一，所以當調包俠可沒法安心。

csdn：通過 keras 快速體驗深度學習之後，如果還想進一步提公升，比如希望透徹理解底層原理和優化，或者這本書的經驗用到移動端深度學習，你有什麼建議？

謝樑：進一步提公升需要跟上最新的進展，可以多讀讀這個領域頂級會議的文章。如果沒有什麼基礎可以從以前的經典**開始讀，輔以 ian goodfellow 與 yoshua bengio 合寫的《深度學習》這本書能較好地了解原理。之後可以關注當前頂級會議的文章，看看最新發展。

csdn：有人評價說 keras 不好除錯，編譯慢，那麼 keras + tensorflow/cntk 是否可以滿足生產環境需求？

謝樑：相對於很多模型的訓練時間，編譯的耗時可以忽略不計。對於輕度的生產環境，keras 本身就可以滿足需求，比如用 neocortex.js 在瀏覽器中根據 keras 模型實時打分。對於負載較大的生產環境或者對實時性要求非常高的生產環境，還是需要直接使用 tensorflow 或者 cntk 的底層 api。

csdn：對於調參，有哪些經驗可以分享？

謝樑：調參對於傳統的機器學習方法通常是通過 cross validation 進行 greedy search，但是對於 hyperparameter 的範圍大致根據經驗有乙個設定。對於深度學習的模型，還是根據資料量大小和特點擊擇合適的結構特徵比較有效。

讀後感微軟首席資料科學家謝樑的AI故事

工程與科學讀後感

資料科學家Docker入門指南

資料科學家成搶手人才

讀後感 微軟首席資料科學家謝樑的AI故事

工程與科學 讀後感

資料科學家Docker入門指南

資料科學家成搶手人才

相關推薦

讀後感微軟首席資料科學家謝樑的AI故事

工程與科學讀後感