語音識別專案報告 pdf

2021-10-25 07:35:08 字數 2069 閱讀 5065

您所在位置:**首頁 > 海量文件

> 中學教育 > 中學課件

語音識別專案報告.pdf61頁

3.登入後可充值,立即自動返金幣,充值渠道很便利

語音識別專案報告

1. 簡介

語音識別即對語音進行處理以得到語音的語義,說話人等資訊。因為語音固有的復

雜性,語音識別是乙個具有挑戰性的問題,每年都有著大量研究。語音識別一般用於

人機互動,公共安全等。

本專案利用altera de2 開發板及sopc 技術實現乙個簡單的語音識別系統。

2. 功能描述

 讀取sd 卡內的語音資料

 5 種語音的訓練

 5 種語音的識別

3. 設計方案

在實現上述功能時,必須考慮以下問題:

 用什麼演算法?

康奈爾大學的final project 裡有乙個做的就是語音識別。演算法是提取固定長度語

音,再提取語音的mfcc 特徵,最後利用mfcc 特徵的前兩項做簡單的大小比較得到

語音的含義。我們在硬體和軟體上都實現了一遍這一演算法,發現結果不如人意。

接著,我們查閱了大量關於語音識別的資料。了解了經典的dtw 演算法,hmm 算

法等。但dtw 演算法計算量龐大而hmm 演算法需要大量語音資料進行訓練,考慮到時間

精力,我們沒有用這些識別度高但計算量大且複雜度高的演算法。

最終,我們在網上找到了另一種簡單的演算法。即事先提取5 種語音的頻率特徵並

儲存,測試時先提取輸入語音的特徵然後與5 種語音的特徵一一比較,特徵最相似的

語音認為是相同語音。我們依然在硬體和軟體上實現了這一演算法,精度較高大概有

90% 的準確率。

 如何實現這一演算法?

一種方法是硬體為主,軟體為輔。就像康奈爾大學final project 裡做的那樣,用硬

件儲存語音並對輸入語音進行fft 變換,再用軟體在fft 的基礎上提取mfcc 特徵並最

終做簡單大小比較。這種方法的好處在於處理速度快,專用度高,缺點是開發周期

長。另一種方法是軟體為主,硬體為輔。這也是本專案所使用的方法。我們主要依靠

sopc 技術,利用cpu 完成大量計算,並對io 進行控制。好處在於可以利用豐富的ip

核及相應的api ,靈活性好,開發周期短。不足在於一般而言處理速度慢於第一種方

法。1. 硬體設計

硬體上我們主要用sopc builder 搭建了乙個小型系統,包含有cpu,sdram 控制

器,音訊模組,七段顯示器模組,撥碼開關模組,sd 卡模組,如下圖所示:

figure 1 sopc 系統

這裡的大部分模組我們用了altera university program 的ip 核,這些ip 核配置簡

單並提供了豐富的api 大大減少了我們的開發難度。下面是具體的內容:

figure 2 sopc builder

1.1. cpu

為了達到最快的處理速度,我們選擇了nios ii/f,並支援hardware divide。

figure 3 cpu 配置

1.2. sdram

因為de2 板子上的sdram 大小為8mb,我們設定sdram controller 的大小也為

8mb 。

figure 4 sdram controller

1.3. led, sw, 7 segment display 等

這裡我們用altera university program ip core 中的parallel port 來控制這些io。其

中led 主要用於對sw 功能進行分類顯示,sw 主要用於控制系統的狀態,七段顯示器

主要用於系統的狀態顯示。這些ip 核都用預設設定即可。我們僅以led 和七段顯示器

為例。1.4. clocks

不同的模組需要用不同的時鐘,如音訊模組一般為12.288mhz,cpu 一般為

50mhz 等。我們用altera university program 的時鐘模組。如下圖所示:

figure 5 時鐘模組

請自覺遵守網際網路相關的政策法規,嚴禁發布色情、暴力、反動的言論。

使用者名稱:

驗證碼:

匿名?

手寫識別專案(7 15)

手寫識別專案總結 7.15 近一周完成了之前計畫表上的兩個任務並有額外完成部分 最初我們認為對程式進行預處理的效果很差是因為程式的不完善,在對程式修改了之後發現還是無法解決預處理效果不好的問題。然後我們轉換了乙個角度,認為有可能是在軟體拍照上傳環節失真所導致的。我們對程式進行修改後,使其可以直接讀取...

鋼管識別專案2

鋼管識別專案2 一 需求 將 鋼管識別專案1 中識別出來的結果匯入csharp的gui中,通過手工輔助操作,對識別的結果進行修正。二 初步分析 現在已經實現了影象處理的相關演算法,能夠自動處理影象得到上圖的結果,那麼下面需要做的就是 2.1 傳遞結果到csharp中去 採用的方法是比較熟悉的 csh...

鋼管識別專案1

鋼管識別專案1 一 原始需求 二 初步分析 鋼管的特點是由於其是有深度的,這就造成了管子的內部形成乙個陰影。尋找並識別這個陰影,是解決問題的主要方法。同時需要注意到的一點是管子它本身的排列是有符合物理特性的,就是大體上要符合下圖的這種情況,這是個先驗知識。干擾在於這個陰影不僅是管子內部才有的,管子和...