我乙個理科生造的AI,怎麼就去做歷史高考題了呢?

2021-09-20 07:50:22 字數 2839 閱讀 9708

文綜提分哪家強?上海交大找ai。

之所以這麼說,是因為arxiv上出現了一篇**,乙個可以答高考歷史題的ai,還能給高考文綜的歷史題「提分」。

而這篇**的作者,是兩位上交的同學,分別來自計算機系和上海市教委智慧型互動與認知工程重點實驗室。

比選擇題難n倍的簡答題

以往ai們「學術研究」的範圍往往是理工科領域,但是zhuosheng zhang和hai zhao兩位同學選擇了乙個完全不一樣的科目:歷史。

而且不是簡單的單選或多選題,他們這次要讓ai來答簡答題。

簡答題,問題千奇百怪。讓ai做簡答題該從**入手呢?

找到文科生的套路

其實高考的歷史簡答題是有「套路」的:題型只有五種,分別是背景、原因、主張、事實、意義。

運用我們從古代詩文、戲曲、民間傳說中已經學到的知識,舉例說明中國古代自給自足的自然經濟的狀況。

原因解釋某些歷史事件、社會現象的原因,如:

春秋戰國時期是社會劇烈動盪的歷史階段,為什麼在這樣的時期會出現思想文化活躍的局面。

主張把歷史上思想家們的觀點寫出來,並加以分析歸納,如:

在啟蒙運動中,眾多的啟蒙思想家的共性思想主張是什麼? 他們之間有何繼承和發展。

事實通過講述歷史事實來分析問題,比如:

「農民可能充當一種極端保守的角色,也可能充當一種具有高度革命性的角色。」 試結合有關史實評析這一觀點。

意義分析歷史事件有什麼意義,這類題我們在中學歷史和政治考卷上見過很多:

用歷史唯物主義和辯證唯物主義的觀點來分析古代雅典民主政治和羅馬法發展的歷程,了解它們對後世的作用和影響。

看明白了五類問題的題型,我們大概對高考的歷史題有了一點清晰的認識。接下來,需要去四處找語料了。

請高中歷史老師幫忙處理資料

歷史是一門敏感的學科,尤其是高考歷史,要是ai的「思想」出了偏差,可就需要接受再教育了。所以,我們只給ai投喂高中歷史課本上的資訊作為語料。

拿到歷史課本後,作者找到了專家,根據課標要求的1929個知識點,提取出了教科書中的1929個文字片段。

然後,拿出珍藏的五三,挑出一定數量的真題,結合教科書中的文字,給這些題目分配對應的答案。

現在,我們得到了1929對帶注釋的問答,然後把這些問答等分為訓練集和測試集兩部分。

最終,我們得到了乙個有一萬多個字的資料集:

ntm+cgnn的模型

現在,有了資料集之後,關鍵來了:

要搭建乙個什麼樣的模型,來接受這些資料的訓練和檢驗,努力像個高中生一樣來回答這些歷史簡答題呢?

這個模型的結構,主要包括兩個部分,乙個是合作門控神經網路(cooperative gated neural network, cgnn),另乙個是神經圖靈機(neural turing machine, ntm)。

整體如下圖所示:

在整個模型中,合作門控神經網路(cooperative gated neural network, cgnn)用於特徵表示和答案檢索。

cgnn的具體工作過程如下圖所示:

模型的另一部分神經圖靈機(neural turing machine, ntm),用來拆解題目,打上各種各樣的標籤。

ntm的工作過程如下圖所示:

打標籤的具體效果,是下面這個樣子:

問題為「分析人類生產力的進步與世界市場形成之間的關係,談談世界市場形成對人類生活方式有何影響。」

標點符號都被去掉了,而所有的詞彙都被拆分成了乙個乙個的標籤用不同深度的紅色表示。

而這個問題的答案也被改為了標籤:

答案第一條:「密切了國際交流,各國與各行業間生產的互補性增強,為世界市場的形成準備了物質條件。」

第二條「引起運輸的技術革命,促進了國際間人口和資金的流動。」

提分成績好,家長很放心

理科生搭建這樣乙個模型,能在文科生的考試裡拿下幾分?

雖說沒正式參加高考,但他們用自己的測試集,檢驗了一下自己模型的成績,和機器問答界的前輩們比拼了一下。

上圖,就是它們的成績單了。括號外邊的,是每種演算法自己取得的成績;括號裡,是這些演算法在與打標籤的ntm配合使用取得的成績;加號,表示的是這些模型在ntm加持下提公升了多少分。

從這份成績單上,可以看出兩點,

一是與前輩演算法們相比,cgnn的確能取得更好的成績。

二是在「標籤法」的助力之下,每種舊演算法的表現都得到了提公升。

github(資料集):

乙個AI產品經理怎麼看AI的發展

乙個ai產品經理怎麼看ai的發展 最近一直在思考這個問題,人工智慧接下來的幾年會有什麼樣的發展,是否真的能夠在很多任務作崗位上取代人類?抑或只是和人類 和諧相處 本文基於作者個人的經驗與知識水平,從乙個人工智慧從業者的角度,來聊一聊技術,體驗和場景,產業發展和生態等方面聊一聊,人工智慧將會有什麼樣的...

我訓練了乙個AI來複製我的聲音,結果嚇壞了我

過去一年以來,我在文章中提到過多家專業從事語音合成技術的企業。其大多數處於早期開發階段,只有少部分能夠拿出可供參考的預製樣本。如今,來自蒙特婁大學學習演算法研究所的研究人員們則正式推出一款工具,可供大家自行體驗這種新型技術。這款工具名為lyrebird,其公開beta測試版只需要利用長度為1分鐘的音...

我是怎麼把乙個專案帶崩的

我是一名專案經理,在過去的四個月裡,我把乙個專案帶崩了 上線後頻出問題,使用者無法使用 在最近的幾天,我每天都在反思自己,我都在問自己以下幾個問題 1.我做錯了什麼?2.我在其中占有多重的因素?以下內容,我將回答以上問題,並在最後說一下我的補救措施。首先給大家說明一下專案背景,以便各位對此專案有更清...