十年育林,百度NLP已枝繁葉茂

2021-10-08 05:07:15 字數 1120 閱讀 2430

種一棵樹,最好的時間是十年前,其次是現在。

7 月 10 日,自然語言處理頂會 acl 2020 落下帷幕。本次大會共收到 3429 篇**投稿,其中 779 篇被接收,接收率為 22.7%,與去年持平,低於近年來大部分年份的接收率。

在這 779 篇**中,有 185 篇來自中國大陸,佔被接收**總數的 23.7%,僅次於美國。此外,今年的最佳**二作和最佳 demo **一作均為華人學生。

然而,很多人可能不知道,2000 年 acl 年會在中國香港舉辦時,只有微軟中國研究院的**來自中國大陸;到了 2005 年,來自大陸的**也只有三篇。

很多變化是過去十幾年發生的,尤其是過去的十年。在這十年裡,中國的 nlp 學界在 acl 年會中的投稿數、被接收**數逐年上公升,同時,中國的 nlp 學者也實現了多個 「第一次」 的突破:

吳華博士在人工智慧領域浸潤 20 餘年,專注於自然語言處理。據統計,她在機器翻譯及自然語言處理領域授權或公開的專利申請有 100 餘項,發表學術** 60 餘篇。

2013 年,王海峰出任 acl 五十年來首位華人主席。

在王海峰等人的共同推動下,2015 年,acl 首次在中國舉辦,體現了國際學界對中國自然語言處理研究的重視和認可。

2018 年,在第 56 屆 acl 年會開幕式上,時任 acl 主席 marti hearst 宣布建立亞太區域分會(aacl)並計畫在 2020 年舉行首次會議。之後每兩年舉行一次會議,會議地點將設定在亞太地區,由王海峰擔任 aacl 創始主席。

將知識融入 nlp 模型多模態語義理解

多模態語義理解是解決複雜場景智慧型化應用的關鍵技術,近年來備受關注。

2010 年左右,科技產業處在迅速的變化之中,人們對資訊媒介的需求已不僅僅侷限於文字,而是向語音、影象等多個方向擴充套件。於是,幾乎在成立 nlp 部門的同一時期,王海峰就已開始著手布局語音技術和視覺技術,牽頭組建了當時的「多**部」。

百度NLP面試記錄(實習offered)

1.自我介紹 2.專案 3.word2vec兩個模式,兩個優化,具體實現細節。4.bilstmcrf的具體實現步驟,crf的原理,優勢。5.attention的原理。6.c 虛函式 7.邏輯回歸用極大似然函式為啥不用最小二乘。8.c 寫快排 1.自我介紹 2.專案 3.transformer的原理,...

百度NLP實習生面試總結

題目1 描述以下兩行 的區別 int a 1000 int p int malloc 1000 回答這道題目的時候,我說前者是定義了1000個整數,大小為4000個位元組,而後者只是開闢了一塊1000個位元組的大小,如果想讓後者的大小與前者相同,應該寫為int p int malloc 1000 s...

百度NLP依存句法分析工具DDParser開源啦

圖1ddparser能做什麼 通過依存句法分析可直接獲取輸入文字中的關聯詞對 長距離依賴詞對等,其對事件抽取 情感分析 問答等任務均有幫助。在事件抽取任務中,我們通過依存分析結果可提取句子中所包含的各種粒度的事件,如 納達爾擊敗梅德韋傑夫 納達爾奪得冠軍 納達爾奪得2019年美網男單冠軍 相應的,在...