新手入門深度學習做語音識別?谷歌AIY也是開源

2021-08-21 10:18:30 字數 1016 閱讀 5753

為解決這一問題,谷歌的tensorflow 和 aiy 團隊建立了tensorflow 和 aiy 團隊建立了speech commands dataset,即「語音命令資料集」。據了解,谷歌也開源該資料集。

tensorflow和aiy團隊開源的資料集包含65000個錄音,每個錄音時長幾秒鐘,包含30個左右的單詞。它們是通過**採集而來的,參與人數達到了數千人。團隊貼心地附上了訓練和**的tensorflow示例**。資料集基於署名4.0 國際(cc by 4.0)許可發布,google表示將繼續擴充這個資料集。google還指出,這個資料集特別適合新手入門。此外,他們也開源了收集錄音的工具。

aiy團隊同時將改款語音資料集應用google人工智慧乙個新的開源硬體產品上,aiy projects,aiy 專案(aiy projects)全稱為 artificial intelligence yourself,意為動手創造你的人工智慧。該專案由 google 於 2017 年啟動,目標是讓每個 maker(創客)都可以 diy 自己的 ai 人工智慧產品。

google 先後在 5 月、12 月份分別推出該專案代表的兩組套件 voice kit 和 vision kit。

voice kit 是 google 首個推出的 diy 人工智慧產品。它可借助 google assistant sdk 和 cloud speech api,將樹莓派 3 轉換為語音數字助理。使用者可在此基礎上建立虛擬語音助手,為自己的專案新增語音互動功能。

vision kit 則是 google 推出的第二彈 diy 人工產品。它是一套簡單的計算機視覺系統,可執行 3 種基於 tensorflow 的類神經網路模型應用程式。

除了工作應用及個人開發愛好,google aiy 套件也已經逐漸被運用到教育科學領域中,用來培養學生對電腦科學的興趣。

新手入門 深度學習常見術語解釋 彙總

主幹網路 提取特徵,是之後完成目標檢測等一系列任務的基礎。e.g.vgg resnet densenet backbone之後連線的網路層。head是獲取網路輸出內容的網路,利用之前提取的特徵,做出 比如獲得影象分類 目標檢測 分類 定位 等任務的結果。e.g.dense prediction on...

TCP IP協議新手入門學習二

表5.從a到b的ip包 在這種情況下,使用ip是多餘的,因為它根本沒有起到什麼作用,用ip只能增加多餘的處理時間,占用了多餘的傳輸頻寬。b接收到這個包後,ip層檢查這個包內的目的位址是不是和自己的ip位址一致,如果一致則將資料返回給上層協議。這稱為直接路由。5.2 間接路由 下面這個示意圖更接近in...

GreenPlum學習筆記 新手入門命令

1.命令列登入資料庫 psql h 192.168.111.111 u username d dbname 其中,username為資料庫使用者名稱,dbname為資料庫名,執行 後提示輸入密碼。可能適用postgresql,不適用gp 2.切換資料庫 c dbname2 username ip p...