語音增強的幾個基本演算法

2021-09-07 12:10:55 字數 1227 閱讀 8195

前言

1)單通道語音增強:主要是《語音增強》書籍內容的梳理;

內容會持續更新,內容為個人的理解,如果存在偏差或者錯誤的地方,還希望各位幫忙指出來。

一、單通道語音增強

選讀《speech enhancement: theory and practice》.主要是自己的讀書筆記.

第一章~第四章,主要介紹語音增強演算法的基礎知識;

chapter 2:discrete-time signal processing and short-time fourier analysis

chapter 3:speech production and perception

chapter 4:noise compensation by human listeners(略)

chapter 5:spectral-subtractive algorithms

主要介紹譜減法。

chapter 6:wiener filtering

主要介紹維納濾波。

chapter 7:statistical-model-based methods

主要介紹基於統計模型的語音演算法,大框架分兩類:最大似然估計,最大後驗概率估計

chapter 8:subspace algorithms

主要介紹子空間演算法,其實就是利用不相關性,借助特徵值分解/奇異值分解進行表達

chapter 9:noise-estimation algorithms

主要介紹雜訊估計的常用方法

chapter 10:evaluating performance of speech enhancement

第十章、第十一章(其實是十二章),主要介紹效能評估的方面,例如指標的選取,對比方法的特性,等等。

chapter 11:comparison of speech enhancement algorithms

二、麥克風陣列增強

delay and sum演算法

mvdr演算法

gsc演算法

tf-gsc演算法

post-filtering演算法

tf-gsc與post-filtering結合

基於MATLAB GUI 的多演算法語音增強系統

語音增強是指當語音頻號被各種各樣的雜訊干擾 甚至淹沒後,從雜訊背景中提取有用的語音頻號,抑制 降低雜訊干擾的技術。一句話,從含噪語音中提取盡可能純淨的原始語音。實際語音遇到的干擾可以分以下幾類 週期性雜訊,例如電氣干擾,發動機旋轉部分引起的干擾等,這類干擾表現為一些離散的窄頻峰 衝激雜訊,例如 些電...

基於小波變換的語音增強演算法簡單綜述

語音通訊是人類傳播資訊,進行交流時使用最多 最自然 最基本的一種手段。而這種通訊中的資訊載體 語音頻號卻是一種時變的 非平穩的訊號,只有在很短的一段時間內 通常為10 30ms 才被認為是平穩的。在語音的產生 處理和傳輸過程中,不可避免地會受到環境雜訊的干擾,使得語音頻號處理系統,如語音編碼和語音識...

基本的幾個排序演算法

氣泡排序 第一次迴圈完畢,最小的在最上面。逐步處理 public sealed class bubble t where t icomparable if exchange 選擇排序 public sealed class select t where t icomparable 插入排序 演算法思...