人工智慧和中國學霸比賽做卷子居然輸了?

2021-10-01 02:01:42 字數 1433 閱讀 2870

4年前,由微軟共同創辦人保羅.艾倫設立的艾倫人工智慧研究所舉辦的一場賽事中,超過700位電腦學者競相開發能通過美國8年級科學考卷的人工智慧,勝者將能獲得8萬美元獎金,然而最終無一達成目標。擁有常人所不能的知識量,過目不忘的ai,竟會被區區國、高中等級的考卷給難倒,或許很難讓人想像。但事實上證明,當時最先進、複雜的ai系統,連取得60分都有困難。因為不管學識含量再豐富,看不懂題目就一點意義也沒有了。不過,最近的ai研究終於攻克阻礙,艾倫人工智慧研究所新推出的ai系統「aristo」成功跨越了這道門檻。且絕不是低空飛過,ai在美國8年級科學測驗中答對9成題目;12年級科學測驗中,也有8成的答題正確率。雖然這有一些「前提條件」──礙於目前ai系統的能力,研究人員刪除了與圖表、有關的題目,因為這需要更高一層將語言理解、邏輯與電腦視覺結合的能力。

儘管如此,aristo依舊深刻展現了人工智慧技術在理解語言脈絡、模擬人類決策邏輯上的重大進展。打造「數字版亞里斯多德」,科學家讓ai寫考卷。早從2023年起,艾倫人工智慧研究所便著手開發aristo,他們希望能打造出乙個「數字版的亞里斯多德」,研究人員認為,比起傳統讓ai下棋的作法,給它們寫科學考卷更具訓練意義。

研究人員指出,對考題的理解並非依靠學習規則就能掌握的,需要ai運用邏輯鏈結不同事物之間的關聯性,就像森林大火增加,就可能造成果實、昆蟲的數量銳減,進而導致松鼠死亡。aristo的基礎源自一套由google建立,名為bert的自然語言處理模型。在徹底研讀維基百科數千篇條目,以及大量浪漫**、科幻**與自行出版書籍後,bert開始學會如何推測句子中闕漏的字詞。藉由這項訓練,bert學會了語言的基本建構方式,而研究人員則給予bert更廣泛的問題與答案,漸漸地,它也學習到如何解答類似的問題。

雖然aristo距離學者的終極目標:模擬人類智慧型,還有一大段距離,目前展現的研究成果,已經足以開創商業應用上的潛力。研究所負責人奧倫.埃齊奧尼(oren etzioni)對此頗具信心,「我能說的是,你將見識新世代產品的誕生,部分源自新創,另一部分則源自大企業。」這些自然語言處理模型,如今已成為許多研究專案的核心,例如用於識別假新聞的工具,以及聊天機械人使用的對話系統。水能載舟,亦能覆舟,也有人擔心,有辦法熟練運用語言的ai,反倒可能助長假新聞散播。

無論如何,這項技術的潛力太過龐大,沒有人敢為其未來做出定論。另一間ai研究室fast.ai研究人員傑瑞公尺.霍華德(jeremy howard)就表示,目前仍處於技術的早期階段,還未探索到其真正的潛力,這項技術最終將抵達何方,可能還沒有人知道。在美國以外,世界各地也有不少科學家將ai研究的目光,放在做考卷身上。

2023年時,中國也曾進行了一場ai與「學霸」們的高考數學比試,最終ai獲得134分,以1分之差惜敗精英學生組的成績平均,但仍向外界揭露ai在做考卷這檔事上,已經越來越上手。

人工智慧如何結合中國製造

5 月 23 日 5 月 27 日,柯潔將與 alphago 對戰。去年三月,這款圍棋人工智慧程式以 4 1 的成績戰勝了圍棋世界冠軍 職業九段選手李世石,之後在中國棋類 上以 大師 master 為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續 60 局無一敗績。不少職業圍棋手認為,阿爾法圍棋的...

人工智慧普及系列 中國AI人工智慧人才需求現狀分析

當前,人工智慧領域的競爭,主要體現為人才之爭。我國ai人才以80後作為主力軍,主要分布在北京 上海 深圳 杭州 廣州,人才需求量也以這些城市居多。根據相關資料顯示,中國592家公司中約有39200位員工,而中國對於ai人才的需求數量已經突破百萬,但國內ai領域人才 量卻很少,人才嚴重短缺,中小企業招...

譯 星際爭霸人工智慧比賽 通告

賴勇浩 昨天在廣州技術沙龍第 3 期的會場上通過 google reader 看到這個訊息 amp from rss 一陣激動。回來就把相關的文件看了一下,覺得蠻有意思,就順手翻譯了。如有錯漏,懇請指正。expressive intelligence studio at uc santa cruz將...