關於語音識別技術的初探

2021-07-27 17:32:04 字數 1691 閱讀 7367

語音識別技術的應用可以分為兩個發展方向:乙個方向是大詞彙量連續語音識別系統,主要應用於計算機的聽寫機,以及與**網或者網際網路相結合的語音資訊查詢服務系統,這些系統都是在計算機平台上實現的;另外乙個重要的發展方向是小型化、可攜式語音產品的應用,如無線手機上的撥號、汽車裝置的語音控制、智慧型玩具、家電遙控等方面的應用。那麼哪些語音識別系統比較好呢?

深圳伊蘭度科技****

深圳市拓豐達數碼科技****

是一家專業生產早教機、故事機、看戲機、藍芽音響、擴音器等電子產品類的開發設計製造商。 

深圳市大誠興科技****

深圳市大誠興科技****是國內一流的電路板廠家

南京子佩軟體科技****

南京子佩軟體科技****是是從事通訊類產品研發、生產、銷售及提供相關通訊運營服務的高科技企業  深圳市智盟教學裝置****

深圳市智盟教學裝置****,專業研發生產,銷售於一體化公司。和國內多家科技,加工中心合作。致力於發展科技前沿和國家發明專利產品。

深圳市賽科斯科技****

公司現有產品包括智慧型停車,管理系統、門禁考勤系統、智慧型梯控系統、巡更系統、智慧型通道系統、區位/車位引導系統等系列產品

上海益深電子****

上海益深電子****,為專業從事語音晶元和家電控制晶元開發、生產、銷售的高科技企業。

深圳市易思科智慧型裝置****

主要生產智慧型道閘、停車場收費系統、三輥閘、擺閘、伸縮門等安防、交通設施產品

廣州科靈電子****

廣州科靈電子****是智慧型一**裝置製造企業,主營:停車場收費管理系統、停車場裝置、高畫質車牌識別一體機、遠距離藍芽系統、道閘/擋車器、人行通道閘(三輥閘、擺閘、翼閘)、電子巡更系統、車位/區位引導系統、電動伸縮門、崗亭、門禁考勤系統、梯控管理系統、交通輔助設施等系列產品,公司擁有完整、科學的質量管理體系。

深圳市苓貫科技****

對於任何產品而言,優質的質量永遠是第一位。

下面說說語音識別的原理:

一般的語音識別系統很龐大,一般的移動裝置根本無法搭建,因此目前大多數語音識別技術都在搭在雲端,就是說你必須聯網。乙個完整的語音互動系統包括語音識別、語音合成(tts)、語義理解、垂直搜尋、智慧型推送等部分。

「你好問問」這種離線語音識別技術主要包括語音識別、實時監聽。首先說說語音識別的技術。

1、我們知道語音是一種聲波,要識別這個聲波首先是分幀(也就是切割聲音)。

2、但聲波只是資料,我們要從中提取資訊,於是就有了「變換與特徵提取」,這裡提取的特徵就是人耳能理解的特徵,表示方式是機器能理解的一系列多維向量。

3、之後就是把特徵向量輸入到程式中(目前主要用深度神經網路 dnn,尤其是 dcnn),把特徵識別成 s 音標(或者說音素)。這裡提到了音素,啥是音素呢?不是 a/b/c/d,而是母音、子音,英語是 48 個音素。對應的,漢語是聲母、韻母。其實這裡面還有乙個「音素的狀態」,是比音素更細緻的東西,暫不提。

4、把音素組合成單詞或者漢字拼音。這個就比較好理解,對吧?乙個漢字拼音或者乙個英文單詞都是由好些個音素組成的。

5、把好些漢字讀音們識別成漢字們。漢字呢,有好多重音字,比英文單詞更複雜些。比如「變換」、「變幻」。此時肯定是沒法理解的,必須放在語境中去。這就需要大量的詞庫啦。說簡單點:1、把聲波切割成幀。2、在幀中提取特徵向量。3、把特徵向量組成音素。4、音素組合成拼音。5、拼音對映成漢字。

參考網頁:

語音識別技術

中科院聲學所將為奧運會提供語音技術支援 日前,由首信集團 首都資訊發展股份 牽頭 中科院聲學所參與其核心模組研製的 奧運會多語言服務 系統被北京奧組委正式採用。這標誌著聲學所在利用自身科研優勢 積極為 科技奧運 做貢獻方面取得了新的成果。從2002年開始,聲學所就參與了由科技部和北京市科委組織,北京...

語音識別技術

雖然人從外部獲取資訊,絕大部分來自來自視覺,可是語音的地位一直很高的,它很好的表表達了人的特徵和清晰的收入方式。其中語音識別技術的地位又是很高的,可以讓機器在字面上明白你在說什麼,這是自然的人機互動的基礎。現在走在語音識別技術前沿的公司有科大訊飛,google 微軟。在我們的前面幾篇 blog 中已...

語音識別技術概覽

語音識別基本和識別類似,都是從傳統的模型到深度神經網路dnn,再到rnn 深度卷積網路cnn。在端到端方面也是從隱馬爾科夫hmm到ctc lfmmi,再到attention方面 下面是一些模型列表 1.混合高斯 隱馬爾科夫模型 gmm hmm 2.深度神經網路 隱馬爾科夫模型 dnn hmm 3.深...