百度AI 開放平台 語音合成

2021-09-29 17:07:24 字數 1889 閱讀 7051

(我選擇使用python sdk 進行開發)

兩個方法都行:

若安裝了pip:

pip install baidu-aip
若安裝了setuptools:

python setup.py install
若在python 環境下import aip沒有報錯,即說明sdk 安裝成功。

aipspeech是語音合成的python sdk 客戶端,為使用語音合成的開發人員提供了一系列的互動方法。

from aip import aipspeech

api_key =

'你的 api key'

secret_key =

'你的 secret key'

若大家需要配置aipspeech的網路請求引數(一般不需要配置),可以在構造aipspeech之後呼叫介面設定引數,目前只支援以下引數:

介面說明

setconnectiontimeoutinmillis

建立連線的超時時間(單位:毫秒)

setsockettimeoutinmillis

通過開啟的連線傳輸資料的超時時間(單位:毫秒)

合成一段語音檔案:

result  = client.synthesis(

,'zh',1

,)# 識別正確返回語音二進位制 錯誤則返回dict 參照下面錯誤碼

ifnot

isinstance

(result,

dict):

with

open

('auido.***'

,'wb'

)as f:

f.write(result)

引數

型別描述

是否必須

texstring

合成的文字,使用utf-8編碼,請注意文字長度必須小於1024位元組

是cuid

string

使用者唯一標識,用來區分使用者,填寫機器 mac 位址或 imei 碼,長度為60以內

否spd

string

語速,取值0-9,預設為5中語速

否pit

string

音調,取值0-9,預設為5中語調

否vol

string

音量,取值0-15,預設為5中音量

否per

string

發音人選擇, 0為女聲,1為男聲,3為情感合成-度逍遙,4為情感合成-度丫丫,預設為普通女

否若成功合成語音,則result就是一段代表語音資訊的二進位制資料流,否則就是一段錯誤資訊(可列印出來檢視)

合成之後我們就可以把這段二進位製流寫到乙個.***檔案中

)若是系統無法區分我們想要其發出的音調,例如「重心」「重慶」,這個「重」很明顯是發不同的音的,這就需要我們在合成語句的text 中進行說明:

result  = client.synthesis(

'我愛重(chong2)慶'

,'zh',1

,)

利用百度AI 合成語音2

文字合成語音 coding utf 8 from aip import aipspeech from playsound import playsound 20232679 api key bzcwdbzfnlynja63iuc6jdxk secret key w0dexqbht0e3ifvphhv...

百度AI開放平台,共建AI生態

以下為劉倩老師演講實錄 各地開發者將ai能力應用在各行各業 120多項場景化能力與解決方案,幫助各行業快速實現ai公升級 多項能力永久免費,全面普惠開發者 定製訓練平台,快速轉化企業定製化需求 ai開放平台最底層是paddlepaddle,既然有了定製化訓練平台,那為什麼還有paddlepaddle...

csharp 百度語音合成

public string api id 3333 你的id public string api record null public string api record format null public string api record hz null public string api k...