如何不知不覺變身AI專家?

2021-08-10 09:29:09 字數 3926 閱讀 3907

原文:you could become an ai master before you know it. here』s how.

翻譯:lloog

譯者注:未來幾年人工智慧會如何發展?除了阿爾法狗令人嘆為觀止的表現,人工智慧確實也正在改變整個行業。但有一點我們是需要注意的,有必要讓ai從總體上變得更加易於使用 。

嚴格的說,scot barton似乎不像是一名人工智慧先驅。他並沒有在建造自動駕駛車輛,也沒有訓練電腦如何在電腦遊戲中擊敗人類。但是值得注意的是,在其所就職的農夫保險公司裡,他正在為某項技術開創道路。

barton領導著乙個資料分析團隊,主要回答關於客戶行為和不同政策設計等問題。從深層神經網路到決策樹,他的團隊現在正在使用各種尖端的機器學習技術。但是barton並沒有雇用一批人工智慧專家來實現這一點。他的團隊使用了乙個被稱為datarobot的平台,它可以將所涉及的很多困難工作自動化。

未來幾年人工智慧會如何發展。除了deepmind的遊戲軟體阿爾法狗令人嘆為觀止的表現,人工智慧確實也正在改變整個行業。使各種各樣的企業生產更高效,反過來又可以通過提高整體生產率來振興經濟。但有一點我們是需要注意的,有必要讓ai從總體上變得更加易於使用。

問題是,現有的人工智慧技術涉及到的許多步驟目前都需要大量的專業知識。而且,這不像是在表面上搭建乙個友好的介面那麼簡單,因為工程師們在編寫和調整**的時候經常需要進行判斷並需要使用到專門的技術。

但是,人工智慧研究人員和公司正在通過將這項技術應用於自身來解決這個問題,利用機器學習將人工智慧演算法開發中棘手的問題自動化。一些專家甚至建立了相當於支援人工智慧的作業系統,旨在使該技術的應用程式與今天的微軟excel一樣簡單易用。

datarobot是朝著這個方向邁出的一步。你提供原始資料,平台對其進行自動清理並重新格式化。然後,它一次執行數十種不同的演算法,並對其效能進行排名。barton首先通過輸入一堆保險資料來檢視是否可以**特定的美元價值的方法來嘗試使用這個平台。與標準的手工統計方法相比,所選擇的模型的錯誤率降低了20%。他表示,「開箱即用,按乙個按鈕;這實在是非常令人印象深刻。」

今年六月,諮詢公司麥肯錫發布了乙份報告,披露了人工智慧應用的現實。這份報告的結論是,人工智慧——特別是機器學習,可能會徹底改變包括製造業、金融業和醫療保健行業在內的大型行業,到2023年可能會在美國經濟中總共佔到1260億美元的規模。但是,報告有乙個嚴重的警告:關鍵人才的短缺。

培養盡可能多的人使用人工智慧當然是非常有幫助的(參見「andrew ng的下乙個技巧:培養一百萬個ai專家」)。但是這需要時間,而且不是每個人都能成為人工智慧大師的。對於任何一種技術來說,要想最大限度地發揮它的影響,就要讓它能夠盡可能方便地被使用。只有當人工智慧能夠滲透進入普通的辦公室和工作場所,才能實現這一點。datarobot已經被用於一些這樣的場合了。

一天下午,坐落於波士頓金融區的datarobot辦公室空蕩蕩的,一大批工程師圍著一台大型顯示器亂轉。該公司的諮詢師jonathan dahlberg給我做了乙個演示,該公司的解決方案真的是令人印象深刻。他載入了乙個貸款申請和付款的公共資料集,然後他讓系統開發出一堆模型,看看關於為什麼人們會違約是否有什麼模式。

幾秒鐘後,螢幕上出現了數十種競爭演算法;在頂部是一種被稱為xgboost的、相對無趣但被廣泛使用的梯度提公升技術。很快,螢幕上就顯示申請人的收入特別重要,但他們想要貸款的原因也是如此。它發現,在申請中提及「創辦企業」的人是乙個特別糟糕的群體。

dahlberg表示,datarobot在專業知識和技能方面,與乙個非常好的資料科學家旗鼓相當,但它可以提供更廣泛的視角。乙個人可能會太依賴某種技術,而datarobot可以自動地找到一種更好的方法。使用者還可以使用python或r程式語言手動修改底層演算法。但不經過仔細的檢查,很難知道該系統在自動化資料科學的一些棘手問題方面到底做得如何,如資料清理和功能工程,但可以確定的是系統處理了驚人數量的資料。

該公司的首席執行官jeremy achin在**了《社交網路》(《the social network》),受到了啟發,萌生了想要創辦一家企業的想法,當我們在麻省理工學院附近的咖啡館會面時,他有點難為情地承認了這一點。但是,但他在參與眾包平台kaggle舉辦的資料科學競賽時產生了datarobot的想法,該平台今年早些時候被谷歌收購。kaggle為從大型資料集中進行特定**時表現最佳的演算法提供了獎品。作為kaggle最早的參賽選手之一,achin意識到自己已經在每場比賽中自動化了很多步驟。 他表示,「我認為,如果我們收集了足夠多的資料集,足夠多的問題,並且執行了足夠多的實驗,我們就可以在機器學習上進行機器學習。這是就是他最初的想法。」

這個想法顯然引發了投資者的共鳴。datarobot自2023年創辦開始,已經籌集了超過1億美元,其中包括今年3月份籌集到的5400萬美元,與此同時,kaggle被谷歌收購了。該公司表示目前已經擁有一百多個客戶。achin表示,這個概念在很多資料科學家那裡並不是那麼受歡迎,他們要麼認為自己的技能無法被自動化,要麼則是擔心這些技能會被自動化。但是他相信,對絕大部分企業來說,如果想要使用人工智慧,就沒有別的選擇。他表示,「我不在乎有多少人在linkedin上將他們的頭銜改為『資料科學家』,這不會帶來很大改觀。」

資料科學家的短缺激發了許多人開始致力於自動化機器學習方面的工作。越來越多的研究**正在使用技術將越來越多人工智慧方面的工作自動化。

世界上最大的人工智慧公司谷歌,也將注意力轉向了這個想法。谷歌已經投入巨資開發強大的人工智慧演算法,並在其服務中部署它們。但該公司也希望在其雲服務中增加更多人工智慧。除了簡單的影象或文字分類工具之外,還意味將更多機器學習模型訓練工作自動化。

負責領導谷歌人工智慧工作的計算機工程師john giannandrea表示:「目標是使這項技術更易於使用」 。「然後任何人都可以說『為我建立乙個**模型』,然後它就會去做乙個模型。」

今年早些時候,該公司宣布了圍繞著這一目標的一些重大進展,演示了能自動化地調整深度學習神經網路的實驗(參見「利用ai軟體學習製作ai軟體」)。 這可能是最強大的機器學習演算法,它們顯著提高了影象和語音識別領域的技術水平。但它們也很難工程化。giannandrea表示,這項工作正在產生一些非常好的結果,在某些情況下與手動開發的系統的效能不相上下。 而且他希望谷歌能夠在未來幾個月內發布更多的結果。

其他人甚至還做出了更巨集大的設計。例如,卡內基梅隆大學教授eric xing正在開發相當於是由不同機器學習元件構建的作業系統。該作業系統使用虛擬化和機器學習來抽象設計和訓練人工智慧工作中的大部分複雜性。它甚至配備了乙個圖形使用者介面,可用於訓練特定資料集上的機器學習模型。

eric xing在中國受過教育,並在加州大學伯克利分校(uc berkeley)與andrew ng一起學習,他現在是世界人工智慧領域的知名人物。他非常有禮貌,而令人意外的是,他想要改變人們使用電腦的方式。eric xing設想他的人工智慧作業系統會非常簡單易用,就像微軟的電子**軟體——excel一樣。他表示,「整個人工智慧行業的核心問題,就是進入的門檻太高了。」

xing建立了乙個名為petuum的公司來開發作業系統,並且已經建立了一系列的工具來將機器學習帶到醫學領域。他表示,「醫生需要乙個介面和醫療記錄、影象——每一種影象都需要不同的機器學習方法。」 petuum正在加緊準備發布平台。

petuum的作業系統和其他一些人工智慧自動化工具將面臨一些獨特的挑戰。已經有關於機器學習演算法無意中吸收了訓練資料中的偏差的擔心出現,並且有些模型太不透明,無法進行仔細檢查(參見「人工智慧核心中的黑暗秘密」)。如果人工智慧變得更加容易使用,這些問題可能會變得更加廣泛和更加根深蒂固。

微軟的高階研究員rich caruana,從事資料科學已經有20年了,說:「要想在機器學習方面做得很好,你需要乙個博士學位和大約5年的經驗。有很多陷阱,你的演算法在六個月後到期了嗎?它是可以解釋的嗎?

資料科學家為防範這些問題而必須採取一些措施,caruana相信這些措施中的一部分應該是有可能自動化的——這類似於飛行員在飛行前的檢查清單。但是他對於過分地信任承諾自動化一切的系統心存警惕。他表示,「我知道這一點是因為一路走來,我一直磕磕絆絆。」

不知不覺發財10大秘訣

1 不斷從薪水中撥出部分款項存起來,5 10 25 都可,反正一定要存 2 搞清楚你的錢每天 每週 每月流向 也就是要詳細列出預算與支出 3 檢查 核對所有的收據,看看商家有沒有多收費 4 銀行卡只保留一張,能夠證明自己的身份就夠了 5 自帶飯菜上班,每年可省下2000元,用它存來作退休 6 與人合...

不知不覺捷達報廢 折騰完了

不知不覺我的小達達也陪伴我十年有餘了,閒來無事曬改裝,本人就是個愛折騰的人,折騰萬歲,為此還經常被家裡領導批評,哈哈 總結下來,改了天使眼日間行車燈,帶透鏡霧燈,遠近氙氣大燈 音響,導航全車密封四門隔音 雙燃料cng系統 還有好多小的記不清了 老婆總是說我愛折騰 這不,前幾個月又把小達達折騰出去了 ...

不知不覺在華工已經3年了

不知不覺在華工已經3年了。今晚走在回宿舍樓的斜坡上,一時無意識抬頭一看 前面橫著一棟女生宿舍樓。忽然想到 這個場景,我已經反反覆覆3年了。但是在意識到3年這個數字之前,卻沒有一絲絲有很漫長很重複很熟悉的感覺。以後補張圖 同樣是3年,這跟高中或者初中,給我帶來的感受完全是不同的。我現在的手機後置攝像頭...