HTK資料準備工具 HLStats

2021-08-27 09:45:33 字數 1702 閱讀 8424

hlstats相對工具比較簡單,主要是從輸入的hmm列表和一系列的標籤檔案中進行統計工作,可以幫助我們分析聲學訓練的資料,也可以生成簡單的語言模型,主要是二元語言模型。這個工具的主要功能如下:

統計hmm列表中不同的音節出現的次數。

統計hmm在標籤檔案中的最小、最大以及平均時長。

計算二元語言模型。

輸出給定標籤檔案的所有被標記標籤籤列表。

一,實際例子

語音識別時的識別單元都分別對應有hmm模型,一般識別單元是音節,這是系統的最小能夠識別的單元(不是hmm中的狀態觀察輸出單元)。

新建乙個htk標籤檔案,內容如下(labels.mlf,該檔案由hled工具生成,具體生成過程見:htk資料準備工具-hled):

#!mlf!#

"*/sample01.lab"

silwahn

wahnw

ahnwah

nwahn

wahnw

ahnwah

nsil

.

除去sil,包含n、w、ah三種音節的hmm模型,所以hmm列表檔案如下:

[root@localhost hlstats]# cat hmmlist nw

ah[root@localhost hlstats]#

生成二元語言模型

[root@localhost hlstats]# hlstats -b bi-model hmmlist labels.mlf 

[root@localhost hlstats]# cat bi-model

!enter 0 2.500000e-01*4

ah 0*2 1 0*2

n 0*3 1 0

w 0 1 0*3

!exit 0 2.500000e-01*4

[root@localhost hlstats]#

上面輸出的二元模型中!enter和!exit是每個標記標籤檔案的預設入口和退出的標籤,這個可以通過-s選項來重新指定,如

[root@localhost hlstats]# hlstats -s sil sil -b bi-model hmmlist labels.mlf 

[root@localhost hlstats]# cat bi-model

sil 0*3 1

ah 0*2 1 0

n 1.250000e-01 0*2 8.750000e-01

w 0 1 0*2

[root@localhost hlstats]#

統計hmm

[root@localhost hlstats]# hlstats -s sil sil -c 100  hmmlist labels.mlf

logical model counts:

label lcount pcount

sil 2 0

w 8 8

n 8 8

ah 8 8

[root@localhost hlstats]#

語音識別工具箱HTK 識別yes 和no

前言 這個htk真心麻煩 真的要學一學怎麼寫乙個指令碼,自動執行這麼多的步驟了 識別效果真的不咋地吧 我發現自己寫的blog 被覆蓋了 很生氣 csdn 的匯出功能不能匯出這是什麼鬼 沒有備份真是乙個巨大的錯誤!參考文獻 官方的文件 htk 基礎指南 特別鳴謝 孫大佬 6.建立hmm模型 7.對模型...

Unity學習 工具準備(一)

工具介紹 unity 4.5.4 vs2013 visual studio 2013 tools for unity unity3d聖典 五大面板 hierarchy 場景資源面板 管理 當前場景 中 出現的所有遊戲物件 project 專案面板 管理 專案中 用到的 所有資源 scene 場景面板...

常用效能測試工具準備

1 指令碼建立除錯 測試執行 結果分析 loadrunner loadrunner11可用於全程的指令碼建立 除錯 測試執行 結果分析 loadrunner12目前只能用於指令碼建立 除錯,暫時無法進行壓測 2 linux伺服器系統資源監控工具 nmon 目前最流行的linux作業系統版本 cent...