語音資料(Audio Data)

2021-09-03 03:58:40 字數 1825 閱讀 9208

kinect for windows有四個麥克風,組成乙個麥克風陣列,可以採集外部傳來的聲單,不但可以收集,還可以除噪,識別。kinect for windows可以識別正前主100度範圍的聲單。kinect for windows通過兩組陣列來定位聲單的方向,乙個是波束角度(beamangle),乙個聲源角度(soundsourceangle)。波束角度是把100度分成10分,分別為50,40,30,20,10,0,-10,-20,-30,-40,-50這11個值,只要在相應的範圍內,取樣就不會重新進行,比如現在在kinect for windows的0度方向,大體上在-5或5的範圍內,波束角度都不會更新。聲源角度就不一樣了,只要聲音達到一定的分貝,它就採信,同時它還跟隨著乙個可信度的值,為0~1之間,1是最可信的,就是聲音的**確定性是最可信的。我們可以通過這兩個引數結合骨骼定位能就kinect for windows周圍的人進行較為準確的定位。

同時,kinect物件有乙個audiosource的屬性,它有乙個start方法,可以返回錄音的資料流。我們對這些資料進行處理就可以。

建立乙個winform

現在看後台**:

public partial class form1 : form  

kinectsensor kinectsensor = null;  

private

void form1_shown(object sender, eventargs e)  

}  }  private

void form1_formclosing(object sender, formclosingeventargs e)  

}  private

void audioreadingthread()  

audiostream.close();  

}  stream.close();  

}  //讓錄音按鈕生效

startrecord_but.enabled = true;  

}  //波束角度採集方法

private

void audiosourcebeamchanged(object sender, beamanglechangedeventargs e)  

//聲源角度和可信度採集方法

private

void audiosourcesoundsourceanglechanged(object sender, soundsourceanglechangedeventargs e)  

private thread readingthread;  

/// 

/// 整型轉陣列

/// 

private

static

void longtointbinary(long val, byte array, int offset)  

/// 

/// 位元組轉短整型

/// 

private

static

void bytetoshortbinary(byte val, byte array, int offset)  

/// 

/// 將超過0x7fff的short型別儲存為int型別。本方法提供了將有符號short型別轉換儲存在位元組陣列中,佔據兩個位元組

/// 

private

static

void toshortbinary(int val, byte array, int offset)  

private

void startrecord_but_click(object sender, eventargs e)  

語音資料(Audio Data)

kinect for windows有四個麥克風,組成乙個麥克風陣列,可以採集外部傳來的聲單,不但可以收集,還可以除噪,識別。kinect for windows可以識別正前主100度範圍的聲單。kinect for windows通過兩組陣列來定位聲單的方向,乙個是波束角度 beamangle 乙...

語音資料(Audio Data)

kinect for windows有四個麥克風,組成乙個麥克風陣列,可以採集外部傳來的聲單,不但可以收集,還可以除噪,識別。kinect for windows可以識別正前主100度範圍的聲單。kinect for windows通過兩組陣列來定位聲單的方向,乙個是波束角度 beamangle 乙...

C 語音識別(文字to語音 語音to文字)

最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...