2018研電賽專案介紹

2021-09-25 03:05:20 字數 853 閱讀 8899

2023年4月份我們準備研電賽的參賽內容,在經過廣泛的查閱資料,並結合自己的研究課題,我提出了兩個idea:

做歌聲音色轉換,將專業歌手的歌聲變成用你的聲音唱出來的

第乙個方案,有現實的需求,難點在於各個房間的語音控制和樹莓派多路音訊流的實現。第二個方案,課題相關。

參賽專案做得是將源歌手的歌聲轉為目標說話人的歌聲。在歌聲音色轉換中,將源歌手的音色轉換為目標說話人的音色的難點在於:

由於歌手和說話人的限制,不存在平行資料集;

突破傳統音色轉換模型「一對一」的限制,實現「多對多」音色轉換;

我們設計了乙個基於變分自編碼-生成對抗網路模型,不需要使用平行資料集訓練,能夠實現多對多轉換。在這個模型中我們將梯度懲罰引入到網路的訓練中,獲得了很好的轉換結果。在得知我們進入決賽後,我們還將模型部署到線上,可以實現實時的語音轉換。

一是實驗方案的設計,要考慮到創新性和可行性,參加研電賽的專案最好能有很強的實用價值,而不是只在實驗室中的玩具。考慮到歌手到歌手之間的轉換由於資料集問題,目前沒有辦法獲得較好的轉換結果,而歌手和說話人之間的轉換資料集沒有問題,可以作為乙個娛樂專案,還比較有應用前景。比如在移動 k 歌軟體中,沒有接受過專業訓練的普通人的歌聲很難達到專業歌手的標準,對於喜歡的歌曲沒辦法很好的完成整首歌的演唱,但是使用者希望能夠唱出專業歌手的水平,這時只需要使用者錄入幾分鐘的語音,然後選擇某歌手演唱的歌曲,模型就能將該歌曲變成使用者的聲音唱出來的;

二是模型的訓練,gan非常難以訓練,經常會出現模式崩塌,即生成的音訊都是一樣的,為此我們引入了帶有w距離的梯度懲罰訓練方法,穩定了gan的訓練,模型才輸出了我們想要的結果。

但是,問題又來了,清唱的歌曲實在難找,尋遍全網找到的資料不夠訓練,怎麼辦?這時只好將純淨的語音拿出一部分也作為訓練集。資料集的問題解決了。

研電賽總結

時光飛逝,往事成煙。驀然回首,依稀記得2015年本科即將畢業之際,張老師 餘老師 金池學長 子銘和我一起開了一次討論會,由金池學長帶領我和子銘初次參賽,我和子銘算是小跟班,學長是絕對主力,學長分配什麼任務我們就負責做什麼,三個人還算配合默契吧。很幸運第一次參賽就獲得了華為命題一等獎,一開始以為企業命...

研電賽專案之羅氏線圈設計

羅氏線圈是乙個均勻纏繞在非磁性材料上的環形線圈,繞中心點旋轉一圈後回到起點,連線到一條線纜上固定。根據法拉第感應定律和楞次定律,交變的電流產生交變的磁場,交變的磁場沿中心線穿過羅氏線圈感應出交變的電壓,交變的電壓與電流變化率成正比 e h did te h frac e h dt di h為線圈的靈...

2018保研經驗

個人背景 學校 末流985 專業 資訊保安 排名 2 46 gpa 3.87 4.5 語言成績 四級580 六級540 學生工作 大一院學生會幹事,大二社團副會長 獲獎情況 三好 一等獎學金若干,美賽h,省市級創新創業比賽一等獎,網際網路 省一,校院級小獎若干 科研 實習 中科院某所實習乙個月,國家...