基於ARM的非特定人語音識別系統設計

隨著高新技術在軍事領域的廣泛運用，**裝備逐步向高、精、尖方向發展。傳統的軍事訓練由於訓練時間長、訓練費用高、訓練空間窄，常常不能達到預期的訓練效果，已不能滿足現代軍事訓練的需要。為解決上述問題，模擬訓練應運而生。

為進一步提高訓練效果，本文利用智慧型語音互動晶元設計了某模擬訓練器的示教與回放系統。示教系統為操作人員生動的演示標準操作流程及相應的操作現象，極大地縮短了對操作人員的培訓時間，提高了培訓效果。回放系統通過記錄操作訓練過程中各操作人員的口令、聲音強度、動作、時間、操作現象等，待操作訓練結束後通過重演訓練過程，以便操作者及時糾正自己的問題。示教系統也可理解為對標準操作訓練過程的回放。該系統不需要虛擬實境技術的支援，在小型的嵌入式系統上就可以實現。

1 系統原理

該模擬訓練器由一台測控計算機和多台從裝置組成。如圖1所示。在此僅對一台從裝置進行介紹，其硬體系統主要由測控計算機、arduino mega2560 控制器、語音識別單元、聲強檢測單元、語音合成單元、面板控制單元、儀器面板等組成。面板控制單元較為複雜，包含多種控制電路，在模擬訓練中負責該從裝置在arduino mega2560 控制器的控制下完成整個訓練過程，在示教與回放系統中完成對剛才操作訓練操作現象的重演，其具體電路設計在此不做介紹。

語音識別單元負責識別操作人員的操作口令;聲強檢測單元負責檢測聲強大小並以此作為判斷是哪台從裝置操作人員口令的依據;arduino mega2560控制器負責監視儀器面板各元件的狀態來識別操作人員的動作，從而完成對操作訓練過程的記錄。各儀器的操作現象根據操作動作事先編制無需記錄。在操作回放過程中，測控計算機根據所記錄的資料，通過控制相應從裝置的arduino mega2560控制器重現所記錄的操作過程。

2 單元系統設計

2.1 語音識別單元設計

目前，語音識別技術的發展十分迅速，按照識別物件的型別可以分為特定人和非特定人語音識別。特定人是指識別物件為專門的人，非特定人是指識別物件是針對大多數使用者，一般需要採集多個人的語音進行錄音和訓練，經過學習，從而達到較高的識別率。

語音識別單元採用atmega168 作為mcu,負責控制ld3320完成所有和語音識別相關的工作，並將識別結果通過串列埠上傳至arduino mega2560 控制器。對ld3320晶元的各種操作，都必須通過暫存器的操作來完成，暫存器讀寫操作有2種方式(標準並行方式和序列spi方式)。在此採用並行方式，將ld3320的資料埠與mcu的i/o口相連。其硬體連線圖如圖3所示。

2.2 聲強檢測單元設計

在進行語音識別時需要判斷是某一台從裝置操作人員的口令，為此設計聲強檢測單元電路，該電路僅需能夠判斷出相對聲強的大小，無需檢測聲級，對檢測精度要求較低。

電容式mic聲音感測器將外部聲音頻號轉換成電訊號，經ne5532放大電路進行放大，將輸入的微弱音訊訊號轉換為具有一定幅值的電壓訊號，該電壓訊號經ac/dc有效值轉換電路進行裝換後進行再次放大，最終由arduino mega2560控制器的a/d進行取樣。圖5給出了聲強檢測單元的電路原理圖，其中d1 端接arduinomega2560控制器的a/d,int1端接arduino mega2560控制器的外部中斷1.當外界聲音頻號大於預設的閾值時，三極體導通int1端由高電平變為低電平產生外部中斷，控制器響應中斷並進行a/d 取樣，取樣資料經均值濾波後儲存，待測控計算機查詢時上傳該聲強資料。

基於ARM的非特定人語音識別系統設計

基於DTW自學習的非特定人語音識別

基於LD3320的非特定人語音識別方案

基於語音的情緒識別系統（Python）

基於ARM的非特定人語音識別系統設計

基於DTW自學習的非特定人語音識別

基於LD3320的非特定人語音識別方案

基於語音的情緒識別系統（Python）

相關推薦