輸入法黑科技 語音識別準確率98 使用者超過6億

2021-10-25 07:30:59 字數 1157 閱讀 1076

圖為6月12日,訊飛輸入法聯合創始人翟吉博在「愛輸入·更懂你」的**見面會上展示黑科技。

訊息 一分鐘打出400字,是什麼樣的體驗?以往只有專業速錄員能實現的打字速度,如今運用了大量ai黑科技的智慧型語音輸入也可以讓你體驗這樣的速度!在速錄的同時它還能讓使用者以語音進行修改、添增、刪除文字的操作。

6月12日,在訊飛輸入法於北京舉辦的「愛輸入·更懂你」的**見面會上,訊飛輸入法市場品牌負責人李強軍介紹說,訊飛輸入法在輸入效率和智慧型化方面取得了長足的進步,不僅做到一分鐘識別400字,還支援多語種實時語音翻譯、超長語音輸入、耳語輸入、離線語音輸入等功能。

截至目前,訊飛輸入法使用者規模突破6億,語音輸入月覆蓋率達50%,語音滲透率保持逐年上公升態勢。

訊飛輸入法聯合創始人翟吉博表示,當前訊飛輸入法的通用語音識別率為98%,同時,對於含糊不清的口音、雜訊環境、多人對話場所等會給語音識別造成影響的場景,也已經有了解決方案。基於科大訊飛精簡和優化的hybrid-dfcnn全新語音識別框架,6月底訊飛輸入法將上線hyper-cnn語音新引擎。此外,還將有效優化中英混合語音輸入、粵語等重點方言、標點判斷準確率、「他」和「她」的區分識別等功能,提公升語音輸入的體驗。

即便說不好普通話,也難不倒訊飛輸入法。翟吉博介紹,目前訊飛輸入法支援22種方言,其中粵語、四川話、東北話等識別率均已超過90%。「依託對ai技術及語言深度研究的積累,採用multi-lingual多語言建模,通過多方言資料共享方式訓練;輔以globalphone全球音素集,從聲學層面的相似性統一各方言的音素定義,對方言『語圖譜』模型做進一步精進,從而有針對性地提公升方言語種的識別能力。」據了解,6月底,訊飛輸入法還將新增蘇州話識別,方言識別語種擴至23種。

2023年,訊飛輸入法對外發起「方言保護計畫」,建立「中國方言庫」,用智慧型語音留存、發展承載傳統文化積澱的方言,積累了海量方言資料,方言識別率日趨精準。為保護瀕危語言、優化方言語音識別能力,6月12日當天科大訊飛還啟動了「ai方言發音人招募」公益行動。

除了方言識別,機器翻譯等新技術也將逐步融合在輸入法中,面對面的互動方式、中文與英日韓俄多語種即時翻譯都將引入語音翻譯應用中。例如,在對話雙方各講母語時,另一方就會同步看到翻譯結果,特別是還加入了語音播報功能,讓面對面翻譯有了自己的「嘴巴」,身邊儼然有了一位「翻譯官」,將翻譯功能場景化。

電腦語音識別輸入法

如何轉換語音?語音識別技術,也被稱為自動語音識別automatic speech recognition,asr 其目標是將人類的語音中的詞彙內容轉換為計算機可讀的輸入,例如按鍵 二進位制編碼或者字串行。與說話人識別及說話人確認不同,後者嘗試識別或確認發出語音的說話人而非其中所包含的詞彙內容。語音識...

訊飛語音識別 訊飛輸入法 語音輸入錄資料

紙筆記錄的資料需要錄成電子版才能進行下一步分析,資料過多時,不僅花費時間變長,失誤率也會增加。經過多次費時費力的手動輸入後,本懶人終於去試了一直念叨的語音輸入,速度和準確率都比較ok,操作也簡單,分享給需要的朋友們。01 準確率高 訊飛輸入法的準確率據說超過了97 錄入資料時,數字123.56讀成 ...

無聲也能語音識別?微軟這個黑科技有點厲害

小時候看特務電影時,們往往有一項必備的技能,就是隔著幾百公尺遠盯著正在說話的物件,從嘴型判斷出對方在說什麼。有了這種記憶,導致如今看什麼語音識別技術都覺得相當一般 我都說出聲兒了你才聽懂,算什麼ai好漢。不過最近一項專利申請表明,微軟正在向 學習,推出了無聲語音識別技術。當ai也能像 一樣,無聲之中...