讀後感 微軟首席資料科學家謝樑的AI故事

2021-08-09 13:48:31 字數 1116 閱讀 6181

csdn:你的著作《keras 快速上手:基於 python 的深度學習實戰》,選擇從 keras 入手簡單、快速地設計模型,較少注底層**,那我們是否可以這麼推導:現在很多演算法都封裝好了,並且工業界應用的模型那麼多,安心當調包俠就可以了?

謝樑:肯定不是這樣的。誠然,現在的機器學習理論和演算法越來越先進,很多以前需要資料科學家和分析師進行的工作都可以由演算法自動完成,比如以前需要做很多人工的特徵工程工作,現在新的演算法將這方面的要求降低,但是如何選擇合適的模型,如何對結果進行合理的解釋仍然需要資料科學家有較好的理論訓練和知識深度。 

在工業界應用機器學習,包括三個部分:

現在有了較多可呼叫的機器學習包,只是讓中段的一些工作簡化,但同時對前端和末端提出了更多的要求,因為現在很多業務問題都非常複雜,如何將其合理地分解為可以進行建模的問題,非常考驗實踐工作者。同時,如何將分析結果植入到現有生產系統中,高效率高質量地執行也是不低的要求。

「調包俠」會是被人工智慧代替的首批白領之一,所以當調包俠可沒法安心。

csdn:通過 keras 快速體驗深度學習之後,如果還想進一步提公升,比如希望透徹理解底層原理和優化,或者這本書的經驗用到移動端深度學習,你有什麼建議?

謝樑:進一步提公升需要跟上最新的進展,可以多讀讀這個領域頂級會議的文章。如果沒有什麼基礎可以從以前的經典**開始讀,輔以 ian goodfellow 與 yoshua bengio 合寫的《深度學習》這本書能較好地了解原理。之後可以關注當前頂級會議的文章,看看最新發展。

csdn:有人評價說 keras 不好除錯,編譯慢,那麼 keras + tensorflow/cntk 是否可以滿足生產環境需求?

謝樑:相對於很多模型的訓練時間,編譯的耗時可以忽略不計。對於輕度的生產環境,keras 本身就可以滿足需求,比如用 neocortex.js 在瀏覽器中根據 keras 模型實時打分。對於負載較大的生產環境或者對實時性要求非常高的生產環境,還是需要直接使用 tensorflow 或者 cntk 的底層 api。

csdn:對於調參,有哪些經驗可以分享?

謝樑:調參對於傳統的機器學習方法通常是通過 cross validation 進行 greedy search,但是對於 hyperparameter 的範圍大致根據經驗有乙個設定。對於深度學習的模型,還是根據資料量大小和特點擊擇合適的結構特徵比較有效。

工程與科學 讀後感

工程與科學首先什麼是工程?百科全書中定義為應用自然科學原理將自然資源,以優化的防止轉換成結構 機器 產品 系統及其工藝,以造福人類的方法。反觀現實世界就有很多例項證明這一點。三峽大壩 還在建造中的華龍一號核電站 由幾個例項我們得知工程的創造首先一點符合為人類服務,其次滿足一定的科學自然原理,基於人類...

資料科學家Docker入門指南

摘要 docker容器那麼強大?可以應用道資料科學領域?看來學習一下!docker容器是通過虛擬化開發和部署應用程式的一種越來越流行的方式,它對資料科學家有用嗎?當然,本指南就會向你介紹它的作用,並手把手教你快速入門。docker是一種越來越流行的,使在容器中開發 部署和執行應用程式變得更容易的工具...

資料科學家成搶手人才

對於乙個理應奇缺人才的領域,資料科學似乎在快速造就大批新專家。不久前,1600人出席了華盛頓大學 university of washington 機器學習教授卡洛斯 格斯特林 carlos guestrin 執掌的公司turi在舊金山主辦的一次資料科學峰會,表明資料科學引起的興趣是多麼的濃厚。格斯...