對中文版「Siri」打個招呼吧!

2021-09-01 14:00:47 字數 2220 閱讀 3350

你可能沒聽說過科大訊飛(iflytek)。這家公司在中國國內市場上幾乎也並非家喻戶曉。但它卻牢牢佔據中國語音識別技術市場份額的80%以上,公司開發的生態系統有超過10000名合作夥伴和開發者,使用者數以億計。

該公司於2023年由中國科學技術大學的學生劉慶峰和其他五名同學創立,該校被廣泛認為是中國最出色的研究機構之一。公司的創始人們利用了學校的國家智慧型計算機研發中心和人機語音交流實驗室的研究成果。

科大訊飛開發出了一系列的文字-語音轉換(tts)產品,最近還開發出語音識別和基於雲的語音技術平台,名為「語音雲」。過去幾年裡,識別準確率穩步提高,該技術也應用在了前所未有的廣泛的產品上。

公司的「語音雲」平台支援語音識別、語音合成和語音輸入應用程式。今年3月,公司開發出語音理解功能,以及被稱為中文版siri的「雨點」,只要有一台能上網的手機就能使用。

ihs isuppli的一位分析師伊安•弗格(ian fogg)表示,語音技術的市場仍然相當不成熟,但是谷歌和nuance這樣的服務商近年來已經利用雲的力量來處理語音詢問,取得了重大進展。他說:「舊模式就是像龍自然語音(dragon naturally speaking)那樣的應用程式,但其缺點是,你必須得訓練它來適應你的聲音。」

劉慶峰承認,科大訊飛與谷歌、nuance公司使用的是「同樣的核心技術」,但他宣稱,公司的開放平台和中國本土的專業技術讓公司的產品比美國的強。

他說,隨著使用者數量由2023年上半年的100萬增加至現在的1億,語音雲平台的識別準確性已經變得更高。

劉慶峰表示:「在中文和中國市場方面,我們和其他競爭對手相比處於更明顯的優勢地位,因為我們有更大的語音資料,每天有1億語音雲的使用者在更新這一資料庫。」

因為中文語調本身的特點,要對中文語音實現正確識別和合成格外困難。也就是說,相同的單詞根據說話語調的不同,可以表示不同的意思。比如廣東話的「gau」就有好幾種意思,其中包括「九」和「狗」。

公司研發經理胡玉(音)表示,出於這個原因,科大訊飛開發了一套「雙源模型系統」,將語調資訊和聲譜分離,來提高辨識準確率。公司還宣稱擁有創新的系統,甚至能夠在嘈雜的環境下,甚至是被干擾的頻道上識別出語音。

劉慶峰認為,科大訊飛成功的關鍵之一在於,願意和公司之外的研究機構合作,這些機構包括中國科學技術大學、清華大學和中國社會科學院語言研究所等。

他說:「語音技術是個典型的跨學科專案,包括不同的學科,比如電腦科學、聲學、語音學和語言學等。在國家科技部的支援下,我們建立了語音與語言資訊處理國家工程實驗室,這是語音語言領域唯一一座國家級實驗室。」

最終,公司的10000個合作夥伴和開發者構成的廣大網路確保了該技術能在範圍廣大的一系列裝置、頻道和應用程式上使用。世界最大的網路運營商中國移動最近收購了公司15%的股份,進一步擴充套件了公司的業務範圍。

他表示,這些合作關係也讓和siri相似的「雨點」用「豐富的資訊資源」,包括娛樂、旅遊和票務資訊等資源來為其使用者群提供更好的服務。

也許在不久之後,公司的技術就會在中國以外的市場上佔據統治地位。對於那些對土生土長的中國公司能否玩轉英語語言技術的懷疑之聲,劉慶峰迅速道出了科大訊飛技術所獲獎項的清單。

公司自2023年至2023年連續7年獲暴雪英語文字-語音轉換國際挑戰賽冠軍,2023年至2023年獲美國國家標準與技術研究院(nist)語音識別評估第一名,2023年和2023年獲美國國家標準與技術研究院語言識別評估第一名。劉慶峰說,公司也已「成功完成」了對其他幾種語言的研發工作,包括日語、韓語、法語、西班牙語和俄語。

中國現已成為世界最大的智慧型手機市場,公司顯然有巨大的發展潛力。

不過ovum的首席分析師丹尼爾•洪(daniel hong)表示,科大訊飛「似乎把注意力集中在相當大的、仍有很大發展空間的壟斷市場上。」his分析師弗格也認為,完全著眼於中國市場的規模,可能在短期內讓公司分心。

總部位於北京的技術諮詢公司邁博瑞諮詢(marbridge consulting)創始人馬克•奈金(mark natkin)則更為樂觀。他說:「我認為如果科大訊飛能夠利用中國市場獨有的特點,獲得發展動力,那麼現有的發展勢頭常常能轉化為海外擴張中的盈利增長。」

abi research的高階分析師麥可•摩根 (michael morgan)表示,科大訊飛通過著眼於中國市場,目前成功規避了像與nuance類似產品所面對的與智財權相關的法律糾紛。「從長期來看,科大訊飛能夠利用其本土語言技術,與本國的手持裝置代工廠商建立合作關係,從而打造出足以進軍全球市場的業務。」摩根說。

公司目前已經與華為、中興和聯想建立了合作關係,隨著這些手持裝置製造商將發展的眼光投向國外,科大訊飛邁向全球市場的步伐可能比預想中要快。

諮詢公司gartner認為,到2023年,在50%的網頁和移動客戶服務互動中,語音將成為人和計算機交流的渠道。

對中文版「Siri」打個招呼吧!

雨點 又名 中文siri 中國任何有手機的人都能夠使用。你可能沒聽說過科大訊飛 iflytek 這家公司在中國國內市場上幾乎也並非家喻戶曉。但它卻牢牢佔據中國語音識別技術市場份額的80 以上,公司開發的生態系統有超過10000名合作夥伴和開發者,使用者數以億計。該公司於1999年由中國科學技術大學的...

Windows Home Server 中文版來了

簡體和正體中文版windows home server將在2008年下半年全面推出了!6月5日,windows home server產品部總經理charlie kindel在台灣宣布了這個訊息。此次中文版在台北computex展出,合作夥伴包括技嘉 gigabyte 威盛 via 啟基 wnc 和...

ilove中文 iLovePDF中文版

軟體介紹 ilovepdf是一款pdf檔案處理工具,可以幫助使用者對pdf檔案進行壓縮 拆分 合併 轉換 編輯等處理,還可以轉換成其它格式,支援pdf檔案瀏覽及加密,是一款很好的pdf檔案工具。軟體特色 離線操作 無需網路連線。你可以隨時隨地進行pdf檔案的壓縮 合併 拆分 轉換和編輯。輕鬆閱讀 使...