語音 音訊演算法方向

2021-08-29 01:54:43 字數 1703 閱讀 3853

喜歡最後的那段話,轉來自勉

1 )語音、音訊編譯碼演算法

已經成熟地商業化、產品化,壓縮位元速率和音質總是一對冤家,只有一些特殊的儲存和通訊應用會要求低位元速率,更多的是追求高品質的音質,例如高畫質音質。

2 )語音識別演算法

做過一年半,初步了解識別率受多種因素影響,技術本身還需要在抗干擾等方面進一步發展,目前只有一些特殊場合的應用產品化,作為人機互動的大規模應用還有一段路要走。

3 )語音合成演算法

4 )語音增強演算法

這個沒有接觸核心技術,感覺回聲消除、降噪處理等還是很有用處。

5 )語音頻號分析

主要一些特殊應用需求,如智慧型玩具、軍工等。

6 )音訊特徵提取和檢索

**哼唱和**檢索,以及音訊的特殊應用。

7 )音效處理演算法

在 *** 上非常普遍的音效處理演算法,當然也有立體聲環繞和多聲道處理演算法。

1 )嵌入式、積體電路、晶元

2 )計算機軟硬體

這個行業裡,可以做標準演算法的研發,也可以做應用程式,或者是第三方軟體開發。

3 )通訊行業

這個行業應該不多,一般音訊編譯碼屬於信源編碼,而通訊行業涉及的技術比較多,從天線的傳送接收,基帶晶元的解碼,語音編譯碼,上下通道的控制等系統。

1 )做標準、第三方演算法研發

做音訊演算法的國際標準,如 itu g.7xx 、寬頻語音編碼,或者第三方語音演算法的研發,如語音識別、語音合成等。往往這樣的職位需要碩士以上學歷,對數字訊號處理理論要求較高。

2 )做移植、優化

3 )做產品應用

做一般多**軟體的應用開發,涉及語音頻本身的理論較少,更多的是計算機技術。

做語音頻演算法職業的缺點是 」 少 」, 相關的公司少,專業對口的職業少,做這個職業的人也少 , 發展機會少一點,當然這個「少」也是不同時期,不同職業之間的相對比較而言的。優點自然是競爭壓力相對小些,工作相對穩定。
我一路走來,犯了許多錯誤,但是塞翁失馬,焉知非福?
1) 雜而不專

「專」是指專注在乙個方向上的技術和業務積累。
2) 專而不精

「精」是指在乙個方向上達到精通的水平(技術方面)和高效的業務能力(專案管理方面)。

工 作了一段時間,比較清楚自己的興趣和特長,於是靜下心盡量把範圍縮小,主要集中在語音頻編譯碼上,但是有時還要根據實際專案需求去做其它方向的。另外,如 果專案時程緊張的話,技術方面如果不經過深加工,積累的經驗還是很少。我目前正處於這個階段,需要堅實的理論基礎以便深入演算法(演算法層面)和不斷的總結項 目經驗教訓(工程實現方面)來提高自己。

3) 精而不廣

「廣」是指見識要廣,具有行業思維、市場化的眼光。

身處在這個賴以謀生的行業,自然要關心一下它的動態發展,我們在技術上要深挖一口井,但眼界上卻不要做乙個井底之蛙!

我自認為資質平 庸,還是踏踏實實做事,認認真真做人。不要盲目和別人攀比,產生不良的心態,影響日常的工作和生活。對於那些比我強的人,我是這樣看的:客觀上,他們一定 有我們不具有的能力,這裡的能力是指綜合評價得到的,包括智商(學習能力、技術深度廣度、創新思維等)、情商(人脈關係、成長環境、習慣等);主觀上,每 個人都有自己的人生軌跡,苦辣酸甜只有自己知道,平衡好自己生活的各個方面才是最好的。

謝謝

語音傳輸 音訊採集

我想做語音傳輸方面的設計,駐極式咪頭採集語音頻號經lm358放大,用的mcu是stm32,請問該電路輸出是否會超過ad的參考電壓3.3v?謝謝!lm358可以用3.3v吧,它的單電源電壓範圍3 32v 是想著打算c2輸出就接mcu的adc引腳,有什麼問題嗎?1.lm358給3.3v供電下,輸入輸出的...

語音頻號處理

濁音的聲帶振動基本頻率 fundamental frequency 稱為基音頻率。濁音的基音頻率 pitch 語音生成系統和語音感知系統 語音頻號生成的數學模型 語音頻號的特性分析 語音頻號處理是以語音語言學和數字訊號處理為基礎的綜合性學科,是用數字訊號處理技術對語音頻號進行處理的一門學科。說話人識...

unity 傳送語音頻息

這裡只講思路 首先用 foreach var device in microphone.devices 取到語音輸入裝置 然後用官方的microphone.start false,10,8000 錄製語音 因為我做的包括手機 所以一般是10秒的8000採集 錄出來的是audioclip 然後這裡把錄...