HTK資料準備工具 HLStats

hlstats相對工具比較簡單，主要是從輸入的hmm列表和一系列的標籤檔案中進行統計工作，可以幫助我們分析聲學訓練的資料，也可以生成簡單的語言模型，主要是二元語言模型。這個工具的主要功能如下：

統計hmm列表中不同的音節出現的次數。

統計hmm在標籤檔案中的最小、最大以及平均時長。

計算二元語言模型。

輸出給定標籤檔案的所有被標記標籤籤列表。

一，實際例子

語音識別時的識別單元都分別對應有hmm模型，一般識別單元是音節，這是系統的最小能夠識別的單元（不是hmm中的狀態觀察輸出單元）。

新建乙個htk標籤檔案，內容如下（labels.mlf，該檔案由hled工具生成,具體生成過程見：htk資料準備工具-hled)：

#!mlf!# "*/sample01.lab" silwahn wahnw ahnwah nwahn wahnw ahnwah nsil

.

除去sil，包含n、w、ah三種音節的hmm模型，所以hmm列表檔案如下：

[root@localhost hlstats]# cat hmmlist nw
ah[root@localhost hlstats]#

生成二元語言模型

[root@localhost hlstats]# hlstats -b bi-model hmmlist labels.mlf 
[root@localhost hlstats]# cat bi-model 
!enter 0 2.500000e-01*4
ah 0*2 1 0*2
n 0*3 1 0
w 0 1 0*3
!exit 0 2.500000e-01*4
[root@localhost hlstats]#

上面輸出的二元模型中!enter和!exit是每個標記標籤檔案的預設入口和退出的標籤，這個可以通過-s選項來重新指定，如

[root@localhost hlstats]# hlstats -s sil sil -b bi-model hmmlist labels.mlf 
[root@localhost hlstats]# cat bi-model 
sil 0*3 1
ah 0*2 1 0
n 1.250000e-01 0*2 8.750000e-01
w 0 1 0*2
[root@localhost hlstats]#

統計hmm

[root@localhost hlstats]# hlstats -s sil sil -c 100 hmmlist labels.mlf logical model counts: label lcount pcount sil 2 0 w 8 8 n 8 8 ah 8 8

[root@localhost hlstats]#

語音識別工具箱HTK 識別yes 和no

前言這個htk真心麻煩真的要學一學怎麼寫乙個指令碼，自動執行這麼多的步驟了識別效果真的不咋地吧我發現自己寫的blog 被覆蓋了很生氣 csdn 的匯出功能不能匯出這是什麼鬼沒有備份真是乙個巨大的錯誤！參考文獻官方的文件 htk 基礎指南特別鳴謝孫大佬 6.建立hmm模型 7.對模型...

Unity學習工具準備（一）

工具介紹 unity 4.5.4 vs2013 visual studio 2013 tools for unity unity3d聖典五大面板 hierarchy 場景資源面板管理當前場景中出現的所有遊戲物件 project 專案面板管理專案中用到的所有資源 scene 場景面板...

常用效能測試工具準備

1 指令碼建立除錯測試執行結果分析 loadrunner loadrunner11可用於全程的指令碼建立除錯測試執行結果分析 loadrunner12目前只能用於指令碼建立除錯，暫時無法進行壓測 2 linux伺服器系統資源監控工具 nmon 目前最流行的linux作業系統版本 cent...

HTK資料準備工具 HLStats

語音識別工具箱HTK 識別yes 和no

Unity學習 工具準備（一）

常用效能測試工具準備

相關推薦

Unity學習工具準備（一）