聊聊麥克風陣列

2021-08-01 14:13:48 字數 1540 閱讀 1232

首先我們簡單聊聊什麼是麥克風陣列。

麥克風陣列 ≠ 一堆麥克風

風吹麥浪,高山流水,蛙聲蟲鳴......人類能聽到的聲音大約有40多萬種,頻率在20至20000赫茲之間。而在嘈雜的環境下,機器想要聽懂聲音,它必須能夠聽的更遠更清晰,人類可以帶上助聽器,機器需要什麼呢?麥克風陣列就充當了助聽器這樣的角色。

麥克風陣列就是由一定數目的聲學感測器(一般是麥克風)組成,用來對聲場的空間特性進行取樣並處理的系統。早在20世紀70、80年代,麥克風陣列已經被應用於語音頻號處理的研究中,進入90年代以來,基於麥克風陣列的語音頻號處理演算法逐漸成為乙個新的研究熱點。而到了「聲控時代」,這項技術的重要性顯得尤為突出。

如果把語音識別看成乙個接收資訊、解析資訊、做出反饋過程的話,麥克風陣列解決的是聽不聽得到、多遠距離屬於合理範圍、不受噪音影響的問題。

單麥克 vs 麥克風陣列

單麥克風系統可以在低雜訊、無混響、距離聲源很近的情況下獲得符合語音識別需求的聲音頻號。但如果聲源距離麥克風距離較遠,並且存在大量的雜訊、多徑反射和混響,導致拾取訊號的質量下降,這會嚴重影響語音識別率。而且,單麥克風接收的訊號,是由多個聲源和環境雜訊疊加的,很難實現各個聲源的分離。這樣就無法實現聲源定位和分離,因為還有一類聲音的疊加並非雜訊,但是在語音識別中也要抑制,就是人聲的干擾,語音識別顯然不能同時識別兩個以上的聲音。

為了解決單麥克風的這些侷限性,利用麥克風陣列進行語音處理的方法應時而生。麥克風陣列由一組按一定幾何結構(常用線形、環形)擺放的麥克風組成,對採集的不同空間方向的聲音頻號進行空時處理,實現雜訊抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益等功能,進而提高語音頻號處理質量,以提高真實環境下的語音識別率。

乙個麥克風不足以接收全部資訊,但麥克風陣列卻可以實現聲源定位、訊號拾取、訊號分離、去除噪音影響等。

1>麥克風結構和麥克風數量

在麥克風陣列裡,麥克風的數量,從2個到上千個不等。複雜的麥克風陣列主要應用於工業和國防領域,而消費級領域的麥克風數量通常較少,一般有2、4、5、6、8等幾種形式。通常,這組麥克風會按照一定幾何結構擺放,比如線形、環形、球形等,比如訊飛開放平台就研發出二麥線性陣列、四麥線性陣列和**麥線性陣列。

2>適用場景解析

可別小看這些結構和數量,不同的組合都對硬體產品來說有著千差萬別的效果。比如雙麥克風陣列的結構簡單,成本低、容易實施、功耗低等特點讓它更容易在家電產品中實現落地。目前國內主流家電廠商應用語音互動技術的產品中,海信電視、美的空調等選擇的大都是雙麥克方案。

不過在機械人領域裡,對聲源定位、降噪、識別率的要求比較高,一般都會使用環形多麥克方案。比如新松機械人使用的是訊飛四麥克風陣列,穿山甲機械人則選用六麥克風陣列。(ps:六麥是環形360拾音,需要水平放置,一般安置在機械人頭頂的位置,而四麥是180度正面的拾音,豎直放置,一般安置在機械人的胸前)。那麼車載、智慧型音箱等領域又如何選擇這些方案呢?自己的產品究竟更適合哪種呢?

麥克風陣列原理

1 麥克風陣列 麥克風陣列,是一組位於空間不同位置的全向麥克風按一定的形狀規則布置形成的陣列,是對空間傳播聲音頻號進行空間取樣的一種裝置,採集到的訊號包含了其空間位置資訊。根據聲源和麥克風陣列之間距離的遠近,可將陣列分為近場模型和遠場模型。根據麥克風陣列的拓撲結構,則可分為線性陣列 平面陣列 體陣列...

麥克風陣列原理

1 麥克風陣列 麥克風陣列,是一組位於空間不同位置的全向麥克風按一定的形狀規則布置形成的陣列,是對空間傳播聲音頻號進行空間取樣的一種裝置,採集到的訊號包含了其空間位置資訊。根據聲源和麥克風陣列之間距離的遠近,可將陣列分為近場模型和遠場模型。根據麥克風陣列的拓撲結構,則可分為線性陣列 平面陣列 體陣列...

麥克風陣列技術(一)

本文給出了麥克風陣列技術和波束形成理論的一些初步知識。所謂麥克風陣列就是放置在空間中不同位置的多個麥克風。根據聲波傳到理論,利用多個麥克風收集到的訊號可以將某一方向傳來的聲音增強或抑制。利用這種方法,麥克風陣列可以將雜訊環境中特定聲音頻號有效的增強。更進一步來說,這種增強效應只依賴與聲源所在的位置,...