深度解密阿里達摩院 如何讓科技與商業共舞

2021-08-21 02:33:25 字數 4467 閱讀 9474

恐怕再沒有乙個科研機構被賦予這麼詩意的名字,達摩院。

它**於武俠**,作為武學最高研究機構,達摩院代表了修為的最高境界。同樣,科研也需要精進、執著和專注的精神。

或許是源於對武學的痴迷,2023年10月,阿里巴巴董事局主席馬雲將新成立的阿里研究院命名為「達摩院」,並宣布未來3年投入1000億,研究自然語言處理、人機自然互動、量子計算、機器學習、基礎演算法等前沿科學領域。

阿里巴巴集團首席技術官、達摩院院長張建鋒(行癲)

從古至今,得人才者得天下。於國而言,他們掌握和創造核心技術,乃國之重器。

在中國前所未有地開放、加速引進全球人才的今天,中國科技巨頭成了重要的國際人才承載平台,也是這一波人才紅利的主要受益者。

在中國科技公司裡,依託於前期人才的儲備和後期達摩院規劃的發力,阿里巴巴用資料、場景和技術優勢,在全球人才爭奪戰中顯示出強大「磁場」。

其實,作為阿里巴巴向「一家科技公司」轉型的結晶。成立9個月以來,達摩院對外界而言,一直披著一層神秘面紗,這個機構有多少人,他們做過哪些事?他們怎麼讓前沿技術從實驗室步入到公眾的日常生活中?

據2023年留學人員回國服務工作部際聯席會議公布的數字顯示,2023年,我國各類留學回國人員總數達48.09萬,創下歷史新高。

更需思考的是,數量龐大的海歸「大拿」得以在達摩院潛心「修煉進化」,在海歸英才人數創紀錄的當下,不少科技公司的核心海歸高管和國外引進的人才接連離職。

科技圈紛紛議論,為何這些頂級人才到中國後,會出現「橘生淮北淮南之差」?答案就在技術觀和價值觀上。

「皇冠」下的科學家群體

故事先從最近的一系列科技賽事說起。

在剛剛結束的計算機視覺知名賽事pascal voc comp4目標檢測大賽上,冠軍來自中國的達摩院。而在這之前,達摩院自主研發的新一代語音識別模型——dfsmn,剛剛打破了全球語音識別準確率紀錄,被谷歌等國外巨頭在**中重點引用。

同樣是近期結束的國際頂級機器翻譯大賽wmt上,達摩院領先眾多國外巨頭與學術研究機構,連奪英文-中文翻譯、英文-俄語互譯、英文-土耳其語互譯5項第一。

再往前,今年一月,在美國史丹福大學發起的機器閱讀理解頂級賽事squad上,阿里巴巴憑藉82.440的精準率打破了世界紀錄,並且超越了人類。賽後英國《每日郵報》的標題是:世界上最難的閱讀理解測試中,阿里巴巴的ai破天荒地戰勝人類!

人們看到的是在成立不到一年時間,達摩院已經在國際頂級技術賽事上,獲得了近20項世界第一。但很少有人知道,達摩院在頂尖科學家上也是是「星光熠熠」。

金榕,美國密西根州立大學終身教授,世界大資料、人工智慧專家;華先勝,國際電氣與電子工程協會院士(ieee fellow),視覺識別和搜尋領域國際級權威學者;施堯耘,世界頂級量子科學家;任小楓,曾是亞馬遜級別最高的華人科學家和最年輕的資深主任科學家之一,也是計算機視覺領域的世界級專家……

悄無聲息,已經有數百名科學家和專家學者活躍在達摩院。

達摩院在國際頂級機器翻譯大賽wmt上取得的五項第一,就是由司羅團隊斬獲的。

司羅,達摩院機器智慧型技術實驗室自然語言處理首席科學家。自然語言處理是一種使機器理解人類語言的ai技術,廣泛應用於搜尋引擎、智慧型客服、商業智慧型和語音助手等領域。

由於這項技術處於人工智慧金字塔的頂尖——認知智慧型,也被譽為人工智慧皇冠上的明珠。

而司羅和團隊,就是製造這顆明珠的人。

2023年從卡內基梅隆大學博士畢業後,司羅就進入普渡大學計算機系任教,專注於機器學習和nlp等領域的研究。2012 年,憑藉100多篇頂級學術**,他成為普渡大學計算機系終身教授。

談及回國加入阿里的原因,司羅給出的答案是:跳出學術研究的小圈子,「第一次看到自己的技術被數以千萬的使用者使用,這種興奮是無法用言語形容的。」 他體會最深的是,在學校他是乙個賦能學生的角色,但跟產業界的人在一起,他能感受到自己的作用和影響力被放大了。

阿里巴巴是司羅發揮能力的理想地,「大部分人工智慧都需要技術、場景和資料三要素的支撐,自然語言處理尤其如此。在這三要素上,企業要比學術界有優勢,阿里在這三塊的優勢更是領先全世界同行。」

達摩院的研究方向主要鎖定在前沿技術領域,而達摩院的科學家們,也是這些領域的佼佼者。

目前,阿里巴巴擁有25000名技術研發工程師、近千名研究員和多名入選mit tr35傑出青年創新人才,這種集產品、學術、研發一體的創新人才梯隊,使得這家企業擁有強大的科技推動力,在資本、技術、人才等方面也已具備了探索科技未來的基礎。

「技術研發絕不是為了**文」

除自然語言處理外,同屬認知智慧型行列的就是語音識別。為此,達摩院機器智慧型技術實驗室還吸引了很多語音識別與智慧型語音互動領域的科學家。

作為達摩院機器智慧型技術實驗室智慧型語音互動的首席科學家,鄢志傑表示相比其它ai技術,智慧型語音雖然相對成熟,但要進一步突破現有技術門檻,並與應用場景深度融合,難度非常大。很多中國公司也缺乏自主創新的戰略耐心,但他從阿里看到了這種決心,於是在2023年加入了達摩院機器智慧型技術實驗室的前身,idst。

此前,鄢志傑在微軟亞洲研究院工作了近8年,主要工作偏重學術研究,比如寫**、在公開標準資料集上做一些演算法方面的提公升。但鄢志傑很想讓自己的研發成果更早落地成為產品,被更多人使用,從而聽到來自使用者的直接反饋,推動技術的進一步發展。

在阿里,達摩院並不是乙個純研究部門,它和業務和商業緊密相連,既有學術思維,也有產品思維和商業邏輯。

鄢志傑介紹說,他在阿里的實驗室有三類人。一是演算法研究,二是做演算法落地,三是推動產品化的工程技術人員。這三類人結合到乙個組織下,能讓演算法的研究成果迅速被產品化。

與一般公司在研究、產品等不同部門之間進行技術轉化不同,達摩院集合了前沿技術探索到產品化落地的完整職能。以阿里自主研發的語音識別模型dfsmn為例,鄢志傑稱,從演算法的驗證結束到最後鋪開到阿里雲上開放給開發者使用,整個過程只用了約1個月。

上海地鐵語音售票機也使用了阿里語音識別技術

司羅介紹,大多數科學家剛到阿里時,還是技術思維多一點,但達摩院更希望技術能與產品、業務一起共舞,讓技術在業務中發揮支撐與引領作用。技術人員只有更深入了解業務情況和業務需求,才有可能更好地將技術能力釋放出來。

所以阿里為這些科學家們準備了乙份見面禮,包括司羅和鄢志傑在內的新入職科學家被要求深入一線,到一線技術部門去鍛鍊。阿里的科學家被要求向業務同事學習商業模式,向產品同事學習產品理念,向客服同事學習使用者喜好。諸如司羅就被派往阿里巴巴的搜尋事業部。

「阿里的技術研發,絕不是為了**文,而是要成為業務發展的眼睛。為未來的業務而研發。」鄢志傑說。

每天7.5億次背後的世界需求

使用者可能沒有意識到,許多前沿的ai技術已經被應用於**、天貓等阿里幾乎所有的產品線上。

記者了解到,達摩院已經成功搭建了包括自然語言處理、語音識別等多個通用技術平台,用於支撐阿里巴巴整個核心技術體系。而司羅所領導的自然語言處理團隊,則肩負著構建阿里巴巴整個自然語言處理技術平台的使命。

全球化是阿里集團未來20年三大核心戰略之一。越來越多的人開始在阿里經濟體上進行全球買和全球賣。讓天下沒有難做的生意,首先要讓大家在語言溝通上零障礙。

以阿里巴巴國際站為例,七成買家以英語溝通,剩下30%為西班牙語、俄語、土耳其語等小語種。阿里對賣家的調研資料顯示,大約96%的賣家對小語種無能為力。這就催生了機器翻譯的巨大需求。而達摩院的機器翻譯技術恰恰填補了這一業務空白,對阿里在俄羅斯、土耳其、西班牙、巴西等地的發展起到有效的支撐。目前阿里的機器翻譯每天被呼叫的使用次數已高達7.5億次。

此外,菜鳥物流通關、阿里雲國際社群、飛豬旅行翻譯助手、釘釘社交口語翻譯等一系列產品也都應用了這一技術。

這才只是達摩院技術帶來的巨大商業價值的冰山一角。

「別樣」達摩院

在科技驅動發展的這個時代,對核心技術的掌握,尤其是在基礎科學、顛覆性技術領域的突破,這將決定企業能走多遠,更決定國家的競爭力。對於要做102年企業的阿里巴巴而言,加大對科技創新研究的投入,走科技驅動的發展路徑,成為一種必然。「達摩院」由此創立。

馬雲對達摩院的發展提出三個要求,「活得要比阿里巴巴長」、「服務全世界至少20億人口」、「必須面向未來、用科技解決未來的問題」。

希望匯聚全球頂尖的科學力量,潛心研究面向未來的核心科技,這是達摩院的目標,真正做到「俠之大者、利國利民」。

在研發體系上,達摩院已經形成了短中長三個層次的研發體系,分別是面向未來3-5年的前沿應用技術、面向未來5-10年的原創性基礎技術、以及面向未來10-20年的前瞻性基礎技術研究。

馬雲在達摩院宣布成立當天發表演講稱,研究不應該是research for fun(為快樂研究),也不應該research for profit(為利潤研究),而是research for solving the problem with profit and fun(為解決問題研究並帶來利潤和快樂)。

「for fun走得太遠,for profit走得太近,都走不長。乙個企業做得多大,在於企業解決多大的社會問題。這是阿里巴巴思考的邏輯。」 馬雲說道,「解決社會問題」是阿里巴巴始終貫徹的技術研發邏輯,阿里巴巴已經不是一家普通的商業公司,要成為一家技術驅動、技術和商業完美結合的公司。

阿里成立達摩院,三年投入超千億

馬雲表示 阿里巴巴前十年最重要的命題是活下去,內部絕對不提成立研究院。阿里巴巴今年18歲了,到了成立研究院的時候了。今天上午,在2017杭州 雲棲大會上,阿里巴巴cto張建鋒宣布,阿里巴巴成立全球研究院 阿里巴巴達摩院,三年投資1000億啟動資金。據張建峰介紹,達摩院由三個部分組成,第乙個部分是在全...

阿里達摩院為什麼吸引到世界頂尖人才?

阿里達摩院為什麼吸引到世界頂尖人才?為何能夠招到或者吸引到世界頂級的人才,其實這個事情裡面有三個原因是必不可少的,那麼下面我們一起來說一說阿里達摩院的人才吸引辦法。阿里巴巴對於每個人來說,都是非常熟悉的,可以說我們現在的生活方方面面都是離不開阿里這家企業,而對於現在的阿里來說,全球的知名度已經是非常...

阿里達摩院自主研發AI晶元 布局「中國芯」

此款晶元的研發,未來將會更好的實現ai智慧型在商業場景中的運用,提公升運算效率 降低成本。阿里巴巴達摩院正自主研發ai晶元 阿里達摩院研究員驕暘介紹,cpu gpu作為通用計算晶元,為處理執行緒邏輯和圖形而設計,處理ai計算問題時功耗高,價效比低,在ai計算領域急需專用架構晶元解決上述問題。事實上,...