AI 生成歌曲《醒來》 可試聽

2021-10-12 12:26:47 字數 1830 閱讀 5990

人工智慧的詩與遠方

在 「2020 網易未來大會」上,由網易伏羲、網易雷火音訊部提供作詞、編曲、演唱的全鏈路 ai 技術支援的歌曲《醒來》正式發布,這也是網易首次完成由人工智慧完全生成的歌曲。單擊試聽

在作詞方面,為讓學會人類語言組織的基本邏輯,網易利用大規模**、文章、詩歌等語料預訓練海量語言模型,並在歌詞語料上訓練端到端的歌詞生成模型,並通過自研的方法控制不同引數情況下的歌詞生成。《醒來》這首歌從開始創作到生成最終作品,總計只花了乙個小時

在編曲方面,網易雷火自研的編曲演算法能夠完成從大量歌曲中提取大眾審美,覆蓋華語樂壇主流風格,率先於行業部署工業出版級智慧型編曲系統,能在 15-30 秒內生成一首對標人編 1-1.5 萬元左右的出版級編曲,已具有工業化大批量生產的能力。

在歌唱合成方面,網易依託音訊部龐大的歌聲資源,自建高音素、音高、風格覆蓋度的合成庫,自研端到端歌聲合成引擎,可在沒有人工干預的情況下,實時根據曲譜生成歌聲。網易自研演算法還可確保歌曲發音人在不同 bpm、風格歌譜上音高、「主唱」聲音完全能夠以假亂真,瞞過人類。

這位由神經網路聲學模型和神經聲碼器完**聲合成的 「主唱」,可以確保歌曲發音人在不同 bpm、風格歌譜上音高、節奏的絕對穩定性。在作詞上,網易的智慧型創作平台學習了大量的**、文章和詩歌等語言材料。覺得聲音聽起來有點像是鄧紫棋。如果感興趣,你可以單擊我試聽

在旋律方面,整首歌節奏輕快,未來感十足,配上歌詞十分有畫面感也很觸動人心,既有虛擬人剛剛覺醒的孤獨悲愴,對待未來不確定性的迷茫彷徨,更有最後主動創造新世界的的熱情勇敢,以**帶入人類與 ai 是否能夠和諧共生的話題,供人思考。

詞法(lexicon)是自然語言處理的基礎層次。西方語言文字多採用空格作為詞間間隔的標記,相對易認易解析。漢語、日語等東方語言多採用無空格的詞語連寫格式,因此需要乙個額外的環節,就是分詞。按給定詞典進行分詞,是中文自然語言處理的經典研究方向,現已有相對成熟的演算法和技術。並不是說這樣的演算法和技術可以獨自在詞法層面解決所有分詞難題,而是說靠這樣的技術可以大體上保持乙個較高的水準,還有一些分詞有歧義的場合,需要結合更大的上下文背景、甚至結合句法分析、語義分析等後續工序的逆向選擇,才能夠搞定。

分詞歧義分成兩類:一類叫做「組合歧義」,另一類叫做「交叉歧義」。依照詞典進行分詞並不是詞法層面唯一的分析任務。其他任務也很實際並且同樣具有挑戰性。詞法分析領域絕非基於詞典的分詞這麼簡單,這個領域還有大量有待攻克的難關,有些難題已經與句法分析攪在一起,非統籌考慮是無法單獨推進的。

自然語言處理技術的應用場景甚廣,大致可分為分析型、生成型和互動型三類。輿情監控系統是典型的分析型系統;自動寫作系統是典型的生成型系統;形形色色的聊天機械人是典型的互動型系統。

自然語言處理能力以平台化方式提供服務,是廣大自然語言處理技術提供者求之不得的事情,但目前還受到一些因素的限制。現實中,更多的自然語言處理技術是融合於乙個更大的行業應用場景中,作為其中一項核心技術來發揮自己的作用的。除了法律、醫療、教育等先行行業之外,金融**行業對自然語言處理技術業有很迫切的落地需求,但往往必須結合專業領域知識和私有資料才能構建有價值的場景。

目前,行業技術提供商、網際網路巨頭和人工智慧創業企業都在進入這個領域。硝煙滾滾,磨刀霍霍,自然語言處理技術為題材的一場好戲已經開場。

cocos2dx 生成怪物及AI

接上一節內容 cocos2dx tmx地圖分層移動處理 本節怪物及簡單ai實現 一 怪物 同cocos2dx v2.3.3編輯器骨骼動畫 裡建立的cplalyer一樣,新建乙個cmonster類,也可以提出乙個公共基類ientity,為了以後擴充套件其他型別的實體做準備。這裡怪物還要有乙個ai的實體...

從此再無真「相」!這些人全部是AI生成的

英偉達研究人員推出的人工智慧演算法stylegan可以合成足以騙過人類的假人臉。不過對於大多數人來說,這項基於生成對抗網路 gan 的技術距離我們還很遙遠。這個問題很快就被一名uber工程師解決了,近日,乙個名為 此人不存在 的 悄然上線。來自 thispersondoesnotexist.com ...

火眼金睛 教你怎麼識別AI生成的假臉

大家先看兩張圖,猜猜下面這兩個人是不是真的,答案後面揭曉。2014年,機器學習研究者ian goodfellow提出了後來非常有名的 生成式對抗網路 gan 之所以稱之為 生成式 是因為網路的輸出並非對輸入進行 比如是不是熱狗 而是盡可能地模仿輸入。這種網路包含兩個相互博弈的神經網路,像 貓捉老鼠 ...