語音庫的分析與評價

2021-10-23 19:40:27 字數 919 閱讀 8468

說話人識別(聲紋識別)語音庫的分析與評價,一般依據以下四個因素:

1、說話人的數量和差異性

2、說話人錄音的次數及錄音間隔

3、語料的型別(固定的短語、帶提示資訊的數字、朗讀句子、對話語音)

4、錄音裝置,錄製環境,傳輸通道

影響因素

選項人數

錄音方式

多次重複錄音、轉錄語音、錄音回放語音

採集裝置

寬頻(麥克風)、窄帶(**、手機)、單/雙通道、立體聲

錄音環境

室內、室外、安靜、嘈雜

距離近場識別 、遠場識別

語速快、適中、慢、時快時慢

音量大、小、時大時小

音色男聲、女聲、童聲

錄音內容

數字串(普通話、英語、方言)、固定短文(普通話:60個音素和韻律分布平穩)、自由發言

口音分布

不同省市、自治區

一些結論:

說話人識別(聲紋識別)的研究核心是解決訓練集和測試集之間的失配(會話變異)問題,導致訓練集和測試集之間差異的主要因素可以分為兩大類

乙個理想的聲紋識別系統,應該在去失配資訊的同時盡量完整地保留說話人的本質特徵

在過去的十幾年間湧現出了很多優秀的失配補償演算法,根據它們的作用域可分為三大類:特徵域分數域模型域

待看:語音質量評價方法-【音訊質量專題】

語音質量評估

polqa

參考:面向移動互聯環境的說話人識別語音庫srmc

錄音回放說話人身份認證語音資料庫

語音識別、聲紋識別的區別及測試

常用程序排程演算法的分析與評價

計算機與資訊科技 摘要本文詳細地討論了四種常用程序排程演算法的基本思想,並對其進行了分析和評價。程序排程演算法,分析,評價 1引言 程序排程是系統內部的低階排程,程序排程的策略通常有先來先服務演算法 時間片輪轉演算法 最高優先權優先排程演算法 最短程序優先排程演算法等。衡量程序排程效能通常需要從定性...

Google字典API與語音庫

用過 google 字典的朋友應該都知道,google 字典的功能相當強大,而且其單詞發音相當的純正,什麼金山什麼有道,在 google 面前都是浮雲,浮雲。但是和 google 的其他專案不同,字典的 api 卻遲遲未能公布,早在 08 年,就有人提向 google 提出希望開發字典 api 的請...

商品評價的語義分析

1類 我就覺得華為的手機比小公尺的好。2類 居然有64g記憶體!3類 噁心人的黑屏啊vs黑屏的厲害vs黑屏啊!4類 小公尺真垃圾,螢幕有劃痕 除了 5類 手機不能吃,做的太堅硬。即使這一步有些分錯了,我們還是勇敢的往下做了 人艱勿拆 感覺造成這種情況的原因有以下幾種,一種是上游任務的錯誤繁衍!一種是...