Audacity語音分析 資料壓縮部分實驗

2021-10-25 17:27:27 字數 1432 閱讀 8056

進行audacity音訊分析

濁音ao

爆破音b

性質驗證

清音:當氣流通過聲門時,如果聲道中某處面積很小,氣流高速衝過此處時產生湍流,當氣流速度與橫截面積之比大於某個臨界速度便產生摩擦音,即清音。

我們可以總結為清音發聲時聲帶不需震動。舉例為:p、t、k、c、q、f、s。

濁音:語音學中,將發音時聲帶振動的音稱為濁音,聲帶不振動的音稱為清音。子音有清有濁,而多數語言中的母音均為濁音,鼻音、邊音、半母音也是濁音。

我們可以總結為清音發聲時聲帶需震動。舉例為:u、ao等常見發音。

爆破音:爆破音是指發音器官在口腔中形成阻礙,然後氣流衝破阻礙而發出的音。在某些情況下,發爆破音時氣流不必衝破阻礙,而只是發音器官在口腔中形成阻礙,並稍做停頓即可。

其中清音和濁音都分別有其爆破音。如:p、g。

這裡我選取了清音f,濁音ao,爆破音b錄製了三段音訊分別用audacity音訊軟體進行了裁剪與時頻域分析,結果如下。由於語音頻號具有短時平穩性,在20ms-30ms內是平穩的便於分析。因此在10ms量級上取50ms分幀處理對語音頻號進行分析觀察。

幅度較小未控制與濁音的強度一致,不過應該不影響頻率分析。

對於清音來說能量集中在高頻區,這一點其實對照濁音的頻譜可以較為明顯的看出。但是其實從影象上來看頻域上各個頻段都有分布,整體起伏較為和緩。而短時平均過零率高得離譜,導致我放大了好幾倍才看的清譜線。相比而言,清音更相似於白雜訊。

濁音能量較為集中的分布在低頻區,高頻區基本沒有譜線了。共振峰較為明顯(這裡好像也不太明顯不過可能是其餘條件干擾?),短時能量較高。可以分析出濁音的短時平均過零率遠遠小於清音。而從時域上看可以清楚的看清它的週期,有乙個乙個的幅值波動,而幅值變化也較為平緩。

由於選擇的是濁音爆破音b,所以其大致譜線與濁音譜線類似,其能量集中在低頻區,卻已經沒有了明顯的共振峰,明顯的向清音的不規則譜線出現了靠攏的趨勢。短時能量很高。

語音分離相關介紹

起源 來自 雞尾酒會效應 人類可以將注意力放在特定的所感興趣的訊息上,可以摒棄環境中的雜訊等的干擾。定義 指通過運用一定的方法從接受到的混合語音頻號中計算出個體訊號的訊號處理技術,它大致可以分成兩個方向 第一,在語音頻號中進行多個聲源之間的分離 第二,在語音頻號中進行單一聲源與雜訊等干擾的分離。1 ...

呼叫中心語音分析系統的作用

現在,呼叫中心管理越來越多地轉向語音分析,以便為管理人員提供更深入地了解在通話過程中所發生的一切。通過語音分析系統,完善了客戶服務呼叫中心服務質量管理 運營分析 滿意度分析 市場營銷效果分析以及自定義分析等應用功能。語音分析系統不但實現了通話內容的實時轉寫 實時分析,為人工坐席提供即時的話術支援,還...

語音轉寫平台 非實時語音分割

1.question1 非實時音訊切割出許多空白音訊 len audio 0 analysis audiosegment.length 14533 audiosegment.get arrays from samples.length 116267 根據audiosegment.arrays長度切割...