阿里和微軟開發的AI模型在斯坦福閱讀測試中勝過人類

2021-09-20 22:20:17 字數 685 閱讀 9368

16日訊息,據國外**報道,阿里和微軟各自開發的ai(人工智慧)模型,在日前舉行的斯坦福閱讀測試中勝過人類。

在上週進行的測試中,參賽公司讓各自的人工智慧系統解答斯坦福問答資料集(stanford question answering dataset)的提問,該資料集評估閱讀理解能力。計算機的答案被與普通人的答覆進行比較,然後據此排名。

該項測試提出的問題包括:「尼古拉特斯拉(nikola tesla)是什麼種族的人」,以及「亞馬遜雨林有多大?」

史丹福大學的測試題基於500多篇維基百科文章編制而成,旨在通過這套試題梳理出線索,看機器學習模型是否能夠在經過大量資訊處理後給出問題的確切答案。

這些題目所構成的試卷被認為是當前世界檢測機器閱讀水平的最權威標準之一。

微軟和阿里巴巴開發的ai模型以微小優勢勝出,在回答的精確匹配度上比人類的82.3%高出幾個基點。

阿里資料科學研究院的自然語言處理首席科學家luo si稱,這個勝利是乙個里程碑,該技術有很多用途,包括客戶服務、博物館講解、醫療查詢,其中一些在全球範圍內已經由聊天機械人(chatbot)處理。

類似的技術已被用於買家提出的常見問題(比如「我的包裹在**?」)。在阿里的光棍購物節期間,這類問題會大量湧入。

本文出處:暢享網

AI模型在移動裝置的部署

近年來,隨著ai技術的快速發展,ai模型部署到移動端裝置的需求越來越強烈。ai模型部署到移動端裝置,能帶來諸多好處 對於公司而言,無需為ai模型部署雲端伺服器,能夠大幅度降低公司的運營和服務成本 然而,ai模型在移動端裝置部署,卻面臨如下挑戰和限制 移動端裝置運算能力有限,儘管現在的移動端裝置的cp...

模型的開發和測試

在談論開發模型和測試模型之前,我們先在談論開發模型和測試模型之前,我們先來了解一下軟體的生命週期 軟體的生命週期分為六個階段 需求分析 計畫 設計 編碼 測試 執行維護。一 開發模型 1.瀑布模型 wate ll model 適用場景 適合需求變化少的專案 是序列的。優點 1 強調開發的階段性 2 ...

在windows上開發阿里雲ECS的程式

阿里雲 ecs 無法使用samba和本地windows pc進行檔案共享,在windows上編輯 放到ecs上執行就很困難。阿里雲上的ecs不通,網上沒找到明確的說法。做了試驗,samba 的tcp 埠139 可以通,但是445不通。網上說445是高危埠,電信運營商一般會關閉。也可以採用更改samb...