5年內 科技會場沒機械人端茶倒水就太low了

2021-09-21 03:26:54 字數 3077 閱讀 6919

都說今年是「人工智慧之年」,科大訊飛在迎來了年底收官之作。如果說,萬物互聯對坊間而言還是乙個比較模糊的概念的話,那麼,今天下午,以「ai復始,萬物更新」為主題的科大訊飛2023年年度發布會就是對人工智慧的全景性思考。科大訊飛董事長劉慶峰現場指出,已經發展了60年的人工智慧未來將迎來三種機遇:

第一,在萬物互聯的浪潮下,以語音為主、以鍵盤觸控為輔的人機互動時代已經到來。未來3到5年,我們周圍的90%的裝置,將不是手機,而是穿戴式裝置、智慧型家居以及可能是服務機械人。這時候沒有螢幕離你很遠,不可能觸控它,而語音為主的時代正在到來。

第二,人工智慧未來一定會像水和電一樣無所不在,廣泛而深入到影響到我們每乙個人生活。我們甚至認為在未來5年之內在這樣的會場,一定會有機械人給大家端茶倒水,否則這樣乙個發布會實在是太沒有科技含量。

第三,以語音和語言為入口的認知革命,將推動人工智慧夢想成真,這是一條人工智慧走認知計算的必由之路。

現場,劉慶峰發布了基於語音互動技術基礎上的互動介面——aiui,以及錄音寶、錄音筆、訊飛聽見網、智學網和e聽說等to c產品。

科大訊飛董事長劉慶峰

2023年的達特茅斯會議是人工智慧研究的歷史起點,至今正好是乙個60年甲子。在這60年中,人工智慧研究本身經歷了兩次波峰與波谷,而從2023年起始至今愈發公升溫的人工智慧熱,是第三次人工智慧浪潮,而當下,正處於人工智慧爆發的前夜。在這第三次浪潮中,中國、美國和歐洲,不約而同地將人類大腦研究上公升為國家戰略科研高度。

「人工智慧未來會像水和電一樣無所不在」劉慶峰表示。而在人工智慧的三個層次——計算智慧型、感知智慧型和認知智慧型之中,前兩者機器的能力已經超越人類,讓機器實現認知智慧型是目前人工智慧科研的焦點,這也是人區別於動物的最本質能力。

而從人類自身的發展來看,產生認知智慧型的標誌是語言的廣泛使用。所以,在第三次人工智慧浪潮中,世界上眾多的科學家都不約而同地從「自然語言理解」這個研究方向上,尋找人工智慧的突破口,即從語音與語言入手實現機器的認知革命。科大訊飛也正是從這個方向上取得了成果。

從2023年成功研發出可實用的中文語音互動系統開始,至2023年發布「訊飛超腦」的這17年間,科大訊飛的這些成果中,包括獲得nist全球語種識別比賽的冠軍,包括獲得jwslt機器翻譯評測冠軍,包括其產品在國內替代人工進行英語口語測試與普通話級別考試,包括其產品在教育、車載、家居、通訊、硬體和****等眾多領域的產業化高速推進,並在這個過程中從一家大學生創業公司,成長成為目前市值超過500億的中國高科技公司。

aiui:機械人未來能參加高考

在產品發布環節,劉慶峰首先定義了認知智慧型的三大核心支撐能力:人機互動、知識管理與推理學習。而隨後科大訊飛發布的訊飛超腦2.0科研專案,正是圍繞這三方面持續展開,不但賦予機器「能聽會說」的能力,還能賦予機器「能理解會思考」的能力,使機械人能夠同人一樣參加高考。

而在訊飛超腦的產業化應用產品層面,劉慶峰發布了對科大訊飛具有里程碑意義的人機互動新產品——aiui。劉慶峰認為,在實際上已經到來的「萬物互聯」時代,客觀上對人機互動提出了更高的要求。但是,一方面目前大多數裝置沒有螢幕並且與使用者之間有一定的距離,另一方面隨時隨地的多方互動的需求越發明顯。

於是,科大訊飛又在此次大會上定義了「萬物互聯」時代的人機語音互動標準,其基本能力應該包括三方面:遠場識別、全雙工、多輪互動。

aiui整合了包括雙全工技術、麥克風陣列技術、聲紋識別技術、方言識別、語義理解技術和內容服務等——科大訊飛一些系列尖端科研成果和完善服務,代表業界最高水準的技術產品。開發者將可以一鍵獲取解決方案,通過整合麥克風陣列、整合sdk以及定製雲端服務等方式。

科大訊飛此次也將aiui應用到了發布會中,現場,所有發言人的演講被實時同步轉寫成文字,顯示在兩側大螢幕上。

也許你對年初那個被車載語音導航逼瘋的山東大漢還印象深刻,乙個普通話不標準的山東人,在環境嘈雜的車上,遠距離與不那麼智慧型的導航交流,產生的結果就是讓人抓狂的識別與互動。而本次發布會上,科大訊飛通過遠場抗噪、方言識別、全雙工互動、多輪對話、糾錯等系列技術,成功打破了山東大漢的困境。

科大訊飛通過定位、麥克風波束形成、回聲消除、抗混響、喚醒一系列技術形成的系統解決了遠距離識別問題。其次,科大訊飛實現了人機對話控制由單工(如手機語音助手的按一下說一下)轉變成全雙工(人和機器可以像打**那樣同時聽和說)的互動轉變。

多輪互動實現了機器對上下文連貫理解,使得人機交流不再是單調的一問一答,而是可以連續交流。再加上對話糾錯機制,人可以隨時糾正對話中雙方的錯誤,使說過的話不再是覆水難收。通過以上一系列技術形成的系統,極大降低了環境、說法、習慣等對人機互動的干擾,實現高度自然的人機互動體驗。

在訊飛超腦的應用層上,科大訊飛面向教育市場推出了智學網與e聽說。

目前,已有全國31個省市的8000萬師生在使用科大訊飛面向k12教育所推出的高科技教學與考評產品,希望解決「老師忙、學生盲、資源茫」的教育行業痛點。

具體產品方面,不僅實現了語音與文字的識別、合成與分類,還實現了智慧型批改、全科閱卷、資源庫自動建設等真正具備「人工智慧」的產品目標,在教育資源的高效和個性化輔導方面做了試水。

目前,科大訊飛中文作文機器閱卷技術在2023年合肥、安慶中學會考上已經取得應用,人機閱卷對比結果顯示機器閱卷已經比人工閱卷更準確。

針對大型會議、現場採訪、個人交流等場景下的內容整理需求,科大訊飛整合了單麥克解混響技術、陣列解混響技術、口語化識別等眾多最新研究成果,全球首發語音科技產品——訊飛聽見錄音寶、錄音筆和訊飛聽見網。

劉慶峰表示,實際上,音文轉寫是當下都市生活的一種經常性需求,在正式發布之前,錄音寶產品已經有了超過100萬的使用者就是這種需求的證明。而隨著流**的不斷演進與普及,相信,在未來的**直播時代,科大訊飛的音文轉錄產品的價值將會更加凸顯。

在現場,科大訊飛還邀請了10家知名速記公司的工作人員,進行同台pk。從現場兩側大螢幕效果看,其速度和準確率可能會在未來淘汰很大一部分速記從業人員。

從科大訊飛發布的產品來看,訂票、改簽、開空調、關加濕器、批改作文等等一律完成,普通話、英語、方言也都能分辨,儼然乙個聰明的生活助手,並在沒有螢幕的情況下,通過語音完成互動。

正如劉慶峰所說,在實際上已經到來的「萬物互聯時代」,語音為主,觸控、影象、手勢為輔,將成為人機互動的新常態,而在這種人類生活的新常態中,人工智慧技術的突破是用來延伸人類能力而非替代人類的。

原文出處:科技行者

歐洲希望在5年內使數字歐元成為現實

歐洲央行行長日前表示,希望在5年內使數字歐元成為現實。這一表態相當於歐洲央行的 政策宣示 數字歐元的推出已經是箭在弦上,不得不發了。多年來,歐洲一直在使用和推廣電子支付方面猶豫不決,對於數位化貨幣更是慎之又慎。2018年,歐盟頒布 第五版反洗錢令 認識到發展數字貨幣是必然趨勢。日前,歐洲央行行長克里...

2023年內容營銷人應該養成的5大習慣

你是否好奇那些牛逼的內容營銷人如何做到與眾不同?你是否想讓自己的內容營銷技巧有新的飛躍?相比於2012年,今年的內容營銷無論是在成熟運作還是創新能力上都有不俗表現。那麼,過往的內容營銷有什麼成功經驗可以借鑑,2014年的內容營銷又呈現怎樣的發展趨勢,來自北美的一項最新研究報告可以為我們提供一些思路。...

馬斯克 特斯拉要在5年內推出電動飛機

對於馬斯克來說,他的野心絕非停留在當前特斯拉車型上,所以他就迫不及待的公布了新的產品。馬斯克表示,電動飛機有可能在 5 年內變為現實。換句話說,程式設計客棧特斯拉要在 5 年內製造電動飛機,不過想要實現可能有點難度,主要電池技術仍然需要大幅改進。長期以來,馬斯克一直表示,將來所有運輸方式都將採用電池...