HTK搭建大詞彙量連續語音識別系統(三)

2021-06-19 23:10:06 字數 2967 閱讀 1609

十、繫結三音素

指令碼mktri.led:

wb sp

wb sil

tc

執行命令:

hled -n labels/triphones1 -i labels/wintry.mlf scripts/mktri.led labels/aligned.mlf
指令碼mktri.hed由指令碼命令生成:

perl scripts/maketrihed data/monophones1 labels/triphones1
把mktri.hed放在scripts資料夾中,執行命令:

hhed -h hmms/hmm9/macros -h hmms/hmm9/hmmdefs -m hmms/hmm10 scripts/mktri.hed data/monophones1
重估兩次:

herest  -a -d -t 1 -c def/config -i labels/wintri.mlf -t 250.0 150.0 1000.0 -s def/train.scp -h hmms/hmm11/macros -h hmms/hmm11/hmmdefs -m hmms/hmm12 labels/triphones1

herest -a -d -t 1 -c def/config -i labels/wintri.mlf -t 250.0 150.0 1000.0 -s stats -s def/train.scp -h hmms/hmm11/macros -h hmms/hmm11/hmmdefs -m hmms/hmm12 labels/triphones1

使用指令碼生成fullist和tielist檔案,命令分別如下:

(1)hdman -b sp -n lists/fullist -g global3.ded -l floag dict/dict4-tri dict/dict4

其中global3.ded如下:

rs cmu

mp sil sil sp tc

而dict4為去掉send-start和silen的新字典,其中生成的fullist中缺少sil,ay,em,ow的音節,加上再執行下面(2)。

hhed -h hmms/hmm12/macros -h hmms/hmm12/hmmdefs -m hmms/hmm13 tree.hed labels/triphones1>log
其中tree.hed使用指令碼生成:

perl scripts/mkclscript.prl tb 350.0 data/monophones1>tree.hed
生成的tree.hed只有tb開頭,在htk自帶的例子中htk\samples\rmhtk\libquests.hed 檔案複製到前面部分,然後在開頭、中間、結尾分別加上如下語句:

(新增)ro 100 stats

(新增)tr 0

qs "r_nonboundary"

qs "r_silence"

qs "r_stop"

………………….

qs "l_y"

qs "l_z"

(新增)tr 2

tb 350.0 "st_ax_2_"

tb 350.0 "st_b_2_"

tb 350.0 "st_r_2_"

……………………

tb 350.0 "st_sil_4_"

tb 350.0 "st_sp_4_"

(新增)tr 1

(新增)au lists/fulllist

(新增)co lists/tiedlist

(新增)st trees

然後重估兩次:
herest -c def/config -i labels/wintry.mlf -t 250.0 150.0 1000.0 -s def/train.scp -h hmms/hmm13/macros -h hmms/hmm13/hmmdefs -m hmms/hmm14 lists/tiedlist

herest -c def/config -i labels/wintry.mlf -t 250.0 150.0 1000.0 -s def/train.scp -h hmms/hmm14/macros -h hmms/hmm14/hmmdefs -m hmms/hmm15 lists/tiedlist

再次評估測試:命令:

hvite -c def/config2 -h hmms/hmm15/macros -h hmms/hmm15/hmmdefs -s test/test.scp -l * -i results/recout_hmm15.mlf -w dict/wdnet -p 0.0 -s 5.0 dict/dict3 lists/tiedlist
其中config2在config的基礎上加上:

forcecxtexp = t

allowxwrdexp = f

執行1個半小時。。。

命令:

hresults -i rest/testwords.mlf lists/tiedlist results/recout_hmm15.mlf
結果如下:

為什麼句子的識別率為0呢???

如何真正提高詞彙量

為什麼中國學生有那麼強的閱讀能力,那麼廣泛的閱讀訓練,外語在真正使用時卻捉襟見肘?為什麼很多同學過了專八,按道理詞彙量 很高 外語在應用時,卻張不開嘴,提不起筆?因為,你的詞彙量,沒有真正提高 那麼什麼叫 真正提高詞彙量 首先,在腦子中強化兩個概念,那就是 認知詞彙 和 積極詞彙 認知詞彙就是指達到...

英語詞彙量測試

60題對了39。詞彙量10028。驚喜中.您在50題中答對了38題。您當前的詞彙量大約為4091 狂鬱悶中.選了level1,8000詞彙量以內的測試。your score 40 80 選level2,最高12000詞彙量的測試 your score 42 120 2個測試結果還挺接近。這個測試沒有...

普通美國人的詞彙量究竟有多少?

經常聽到有些朋友說,中國孩子投入太多的時間學習英語,以至於他們的詞彙量大大超過了同年齡的美國孩子。還有人說,普通美國人的詞彙量只有五千,因此只要學會五千英語單詞就足以應付絕大多數場合了。那麼真實的情況是怎樣的呢?對於將英語作為主要外語的中國學生來說,我們究竟應該學習多少英語單詞才能基本夠用?說到英語...