人工智慧和中國學霸比賽做卷子居然輸了？

4年前，由微軟共同創辦人保羅．艾倫設立的艾倫人工智慧研究所舉辦的一場賽事中，超過700位電腦學者競相開發能通過美國8年級科學考卷的人工智慧，勝者將能獲得8萬美元獎金，然而最終無一達成目標。擁有常人所不能的知識量，過目不忘的ai，竟會被區區國、高中等級的考卷給難倒，或許很難讓人想像。但事實上證明，當時最先進、複雜的ai系統，連取得60分都有困難。因為不管學識含量再豐富，看不懂題目就一點意義也沒有了。不過，最近的ai研究終於攻克阻礙，艾倫人工智慧研究所新推出的ai系統「aristo」成功跨越了這道門檻。且絕不是低空飛過，ai在美國8年級科學測驗中答對9成題目；12年級科學測驗中，也有8成的答題正確率。雖然這有一些「前提條件」──礙於目前ai系統的能力，研究人員刪除了與圖表、有關的題目，因為這需要更高一層將語言理解、邏輯與電腦視覺結合的能力。

儘管如此，aristo依舊深刻展現了人工智慧技術在理解語言脈絡、模擬人類決策邏輯上的重大進展。打造「數字版亞里斯多德」，科學家讓ai寫考卷。早從2023年起，艾倫人工智慧研究所便著手開發aristo，他們希望能打造出乙個「數字版的亞里斯多德」，研究人員認為，比起傳統讓ai下棋的作法，給它們寫科學考卷更具訓練意義。

研究人員指出，對考題的理解並非依靠學習規則就能掌握的，需要ai運用邏輯鏈結不同事物之間的關聯性，就像森林大火增加，就可能造成果實、昆蟲的數量銳減，進而導致松鼠死亡。aristo的基礎源自一套由google建立，名為bert的自然語言處理模型。在徹底研讀維基百科數千篇條目，以及大量浪漫**、科幻**與自行出版書籍後，bert開始學會如何推測句子中闕漏的字詞。藉由這項訓練，bert學會了語言的基本建構方式，而研究人員則給予bert更廣泛的問題與答案，漸漸地，它也學習到如何解答類似的問題。

雖然aristo距離學者的終極目標：模擬人類智慧型，還有一大段距離，目前展現的研究成果，已經足以開創商業應用上的潛力。研究所負責人奧倫．埃齊奧尼（oren etzioni）對此頗具信心，「我能說的是，你將見識新世代產品的誕生，部分源自新創，另一部分則源自大企業。」這些自然語言處理模型，如今已成為許多研究專案的核心，例如用於識別假新聞的工具，以及聊天機械人使用的對話系統。水能載舟，亦能覆舟，也有人擔心，有辦法熟練運用語言的ai，反倒可能助長假新聞散播。

無論如何，這項技術的潛力太過龐大，沒有人敢為其未來做出定論。另一間ai研究室fast.ai研究人員傑瑞公尺．霍華德（jeremy howard）就表示，目前仍處於技術的早期階段，還未探索到其真正的潛力，這項技術最終將抵達何方，可能還沒有人知道。在美國以外，世界各地也有不少科學家將ai研究的目光，放在做考卷身上。

2023年時，中國也曾進行了一場ai與「學霸」們的高考數學比試，最終ai獲得134分，以1分之差惜敗精英學生組的成績平均，但仍向外界揭露ai在做考卷這檔事上，已經越來越上手。

人工智慧和中國學霸比賽做卷子居然輸了？

人工智慧如何結合中國製造

人工智慧普及系列中國AI人工智慧人才需求現狀分析

譯星際爭霸人工智慧比賽通告

人工智慧和中國學霸比賽做卷子居然輸了？

人工智慧如何結合中國製造

人工智慧普及系列 中國AI人工智慧人才需求現狀分析

譯 星際爭霸人工智慧比賽 通告

相關推薦

人工智慧普及系列中國AI人工智慧人才需求現狀分析

譯星際爭霸人工智慧比賽通告