語音識別揭秘 你的手機究竟有多理解你?

2021-10-25 07:33:04 字數 810 閱讀 8006

在我們的生活中,語言是傳遞資訊最重要的方式,它能夠讓人們之間互相了解。人和機器之間的互動也是相同的道理,讓機械人知道人類要做什麼、怎麼做。互動的方式有動作、文字或語音等等,其中語音互動越來越被重視,因為隨著網際網路上智慧型硬體的普及,產生了各種網際網路的入口方式,而語音是最簡單、最直接的互動方式,是最通用的輸入模式。

語音識別(asr)原理

(1)語音輸入的預處理模組

(2)特徵提取

(3)聲學模型訓練

(4)語言模型訓練

(5)語音解碼和搜尋演算法

站在巨人的肩膀上:開源框架

(1)cmu sphinix是卡內基梅隆大學的研究成果。已有 20 年歷史了,在 github和 sourceforge上都已經開源了,而且兩個平台上都有較高的活躍度。

(2)kaldi 從 2009 年的研討會起就有它的學術根基了,現在已經在 github上開源,開發活躍度較高。

(3)htk 始於劍橋大學,已經商用較長時間,但是現在版權已經不再開源軟體了。它的最新版本更新於 2015 年 12 月。

(4)julius起源於 1997 年,最後乙個主版本發布於2016 年 9 月,主要支援的是日語。

語音識別技術研究難點

(1)輸入無法標準統一

(2)雜訊的困擾

(3)模型的有效性

智慧型語音識別系統研發方向

我們究竟有多愛我們的Wi Fi

在乙份涉及300個北美及歐洲的wi fi使用者的調查中,xirrus發現76 的消費者出門在外時都會習慣性連線wi fi。回到家中,更有94 的人都會使用wi fi。這個調查結果似乎並不讓人感到驚奇,但xirrus同時發現,79 的受訪者儘管認為公共wi fi不安全,使用起來卻根本停不下來。62 的...

定製你的語音識別 並行語音識別解碼空間

圖1為通用的語音識別解碼器框架,聲學模型我們採取的是隱馬爾可夫模型模型,其發射概率為混合高斯矩陣。語言模型我們採用的是n gram的方式。這裡聲學模型和語言模型都為單一的乙個模型。圖1 通用的語音識別系統框架 圖2 並行解碼空間的系框框架 相對通用的解碼系統,並行解碼空間系統主要增加了三個模組 多路...

智慧型語音識別究竟是如何實現的?

智慧型化生活 當你睜開雙眼體味著清晨第一抹陽光!智慧型裝置就已經在自動工作了,機械人幫你打掃屋子,處理檔案,烹飪早餐!走出街道搭乘ai汽車,進入公司,迎面是智慧型前台!就工作當中接到的 or收到的資訊,都有可能歷經智慧型化處理。這些場景在幾十年前根本是不敢想象的,而如今大部分已經實現!作為人工智慧基...