語音識別 字典

2021-09-22 12:53:01 字數 561 閱讀 8888

語音識別中的字典也被稱為發音字典,顧名思義就是用來描述各個詞的發音或者說給出各個詞和音素之間的關係;

語音識別系統中所有詞的結果均出自於字典,也就是說他是識別系統處理詞和音素的集合;通過發音字典得到聲學模型的建模單元和語言模型建模單元間的對映關係,從而把聲學模型和語言模型連線起來,組成乙個搜尋的狀態空間用於解碼器進行解碼工作;

以中文識別為例:

step 1:

首先需要確定的是拼音到音素的轉換規則/對映關係。

可以有不同的對映關係,如漢字一的拼音 「yi1」可以對應 「ii i1」,也可以對應 「y i1」(前者是清華語音識別使用的規則)。

不同的對映關係會產生不同的識別效果。

step 2:

需要列出盡可能多的中文詞及其對應的拼音,有多音字的可列出其不同組合。

step 3:

通過以上兩個步驟即可實現中文詞-音素的轉換,也就是g2p(grapheme-to-phoneme conversion)。

通過指令碼可實現輸入中文詞,輸出對應音素的功能。

4.參考文獻:

what is g2p?

內容**

車牌識別字元模板庫

車牌識別字元模板庫 你好!這是你第一次使用markdown編輯器所展示的歡迎頁。如果你想學習如何使用markdown編輯器,可以仔細閱讀這篇文章,了解一下markdown的基本語法知識。全新的介面設計,將會帶來全新的寫作體驗 在創作中心設定你喜愛的 高亮樣式,markdown將 片顯示選擇的高亮樣式...

模式識別 字元識別演算法設計

由於英文本母有26個,因此在對這26個字母進行識別時要採用多種方式結合進行識別 1 採用是否含有封閉區域來區分 可以分辨出b,d,q,r,o,p,a 具體使用演算法 採用填充演算法,如果不能填充則說明不存在封閉區域 具體演算法 將字母二值化處理,從其中任意一畫素點出發,沿著水平方向 或者垂直方向 辨...

解決mariadb識別字母大小敏感問題

mariadb是mysql資料庫下的乙個分支,為什麼要用mariadb呢?是因為他是永久開源的,mysql自從被人收購後有不開源的風險,切換成mariadb也蠻容易的,但 linux下安裝好mariadb後,在使用時會發現mariadb對大小寫敏感,這對開發帶來一定的不利,這時只要在配置檔案中配置一...