Sphinx 離線語音識別研究(一)

2021-08-27 15:04:29 字數 1769 閱讀 9911

編譯環境: ubuntu 12.04

安裝pocketsphinx

由於pocketsphinx依賴於另外乙個庫sphinxbase,所以先需要安裝sphinxbase。

(1)安裝sphinxbase

tar xzf sphinxbase

.tar.gz

cd sphinxbase

./configure

make

sudo make install

預設安裝在/usr/local/bin下面,ls可檢視。

(2)安裝pocketsphinx

export ld_library_path=/usr/local/lib

export pkg_config_path=/usr/local/lib/pkgconfig

cd pocketsphinx

./configure

make

sudo make install

完成安裝,在/usr/local/bin下面可以看到三個新生成的檔案,

cd /usr/local/bin ls

pocketsphinx_batch

pocketsphinx_continuous

pocketsphinx_mdef_convert

測試下安裝結果

pocketsphinx_continuous

若出現如下資訊,說明安裝成功。

info: cmd_ln.c(512): parsing command line:

pocketsphinx_continuous

current configuration:

[name] [deflt] [value]

-adcdev

-agc none none

-agcthresh 2.0 2.000000e+00

-alpha 0.97 9.700000e-01

-argfile

-ascale 20.0 2.000000e+01

-backtrace no no

-beam 1e-48 1.000000e-48

-bestpath yes yes

-bestpathlw 9.5 9.500000e+00

-bghist no no

-ceplen 13 13

-cmn current current

-cmninit 8.0 8.0

………………………………….

…………………………………

………………………………….

info: ngram_search_fwdtree.c(333): after: 457 root, 13300 non-root channels, 26 single-phone words

info: ngram_search_fwdflat.c(153): fwdflat: min_ef_width = 4, max_sf_win = 25

warning: could not find mic element

info: continuous.c(261): pocketsphinx_continuous compiled on: feb 21 2011, at: 22:31:47

ready....

Sphinx4語音識別的框架

sphinx4主要由三個基本模組構成 frontend,decoder,linguist。frontend接受訊號的輸入並且轉化為特徵序列。linguist把任何型別的標準語言模型,字典的發音資訊以及一些聲學模型的結構資訊轉換為乙個searchgraph。在decoder 中的searchmanag...

智慧型家居中語音識別演算法研究 語音識別之DTW演算法

一 語音識別 在介紹dtw演算法之前,首先簡單了解一下語音識別的操作步驟。主要有5個步驟,具體流程如圖1所示。圖1 語音識別流程圖 1預處理 提取真正需要分析的音訊訊號,主要包括靜音切除和聲音分幀兩部分操作。其中靜音切除部分主要採用的是語音活動檢測 voice activity detection,...

離線語音控制並不等於本地語音識別

木瓜電子可以為國內各大家電產商提供離線語音控制的模組和晶元產品,但是沒有本地語音識別的方案。這兩者區別的地方是什麼呢?針對家電產品控制進行解釋一些這兩者之前的區別。離線語音控制,木瓜電子提供的離線語音控制模組和晶元,很明確這些語音產品的是適合應用在控制家電等裝置的,不需要連線網路進行語音識別,說出命...