kinect for windows有四個麥克風,組成乙個麥克風陣列,可以採集外部傳來的聲單,不但可以收集,還可以除噪,識別。kinect for windows可以識別正前主100度範圍的聲單。kinect for windows通過兩組陣列來定位聲單的方向,乙個是波束角度(beamangle),乙個聲源角度(soundsourceangle)。波束角度是把100度分成10分,分別為50,40,30,20,10,0,-10,-20,-30,-40,-50這11個值,只要在相應的範圍內,取樣就不會重新進行,比如現在在kinect for windows的0度方向,大體上在-5或5的範圍內,波束角度都不會更新。聲源角度就不一樣了,只要聲音達到一定的分貝,它就採信,同時它還跟隨著乙個可信度的值,為0~1之間,1是最可信的,就是聲音的**確定性是最可信的。我們可以通過這兩個引數結合骨骼定位能就kinect for windows周圍的人進行較為準確的定位。
同時,kinect物件有乙個audiosource的屬性,它有乙個start方法,可以返回錄音的資料流。我們對這些資料進行處理就可以。
建立乙個winform
現在看後台**:
public partial class form1 : formkinectsensor kinectsensor = null;
private
void form1_shown(object sender, eventargs e)
} } private
void form1_formclosing(object sender, formclosingeventargs e)
} private
void audioreadingthread()
audiostream.close();
} stream.close();
} //讓錄音按鈕生效
startrecord_but.enabled = true;
} //波束角度採集方法
private
void audiosourcebeamchanged(object sender, beamanglechangedeventargs e)
//聲源角度和可信度採集方法
private
void audiosourcesoundsourceanglechanged(object sender, soundsourceanglechangedeventargs e)
private thread readingthread;
///
/// 整型轉陣列
///
private
static
void longtointbinary(long val, byte array, int offset)
///
/// 位元組轉短整型
///
private
static
void bytetoshortbinary(byte val, byte array, int offset)
///
/// 將超過0x7fff的short型別儲存為int型別。本方法提供了將有符號short型別轉換儲存在位元組陣列中,佔據兩個位元組
///
private
static
void toshortbinary(int val, byte array, int offset)
private
void startrecord_but_click(object sender, eventargs e)
}
語音資料(Audio Data)
kinect for windows有四個麥克風,組成乙個麥克風陣列,可以採集外部傳來的聲單,不但可以收集,還可以除噪,識別。kinect for windows可以識別正前主100度範圍的聲單。kinect for windows通過兩組陣列來定位聲單的方向,乙個是波束角度 beamangle 乙...
語音資料(Audio Data)
kinect for windows有四個麥克風,組成乙個麥克風陣列,可以採集外部傳來的聲單,不但可以收集,還可以除噪,識別。kinect for windows可以識別正前主100度範圍的聲單。kinect for windows通過兩組陣列來定位聲單的方向,乙個是波束角度 beamangle 乙...
C 語音識別(文字to語音 語音to文字)
最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...