阿里入局智慧型音箱 一次人工智慧的「探索」

2021-09-23 03:01:28 字數 3150 閱讀 8681

上週,關於阿里巴巴旗下人工智慧實驗室(a.i. labs)誕生的訊息不脛而走,殊不知該實驗室早在2023年低調成立。昨天下午,這個專門研發消費級ai產品的實驗室高調推出研發的第一款智慧型語音終端裝置——天貓精靈x1,內建阿里第一代人機交流系統——aligenie。

現場,阿里人工智慧實驗室負責人淺雪兩句開場白,道出阿里入局智慧型語音助手市場的初衷:

「語言是人與人之間最主要的溝通方式,也應該是人與另外一種智慧型進行交流的主要方式。」「雲端一體化帶來的趨勢是高度智慧型化,智慧型終端需要乙個比手機觸屏更強大的人機互動方式。」

智慧型語音群龍紛爭

我們不禁要問,玩家之多,投入之大,當中原因是什麼?

如淺雪所言,上個世紀90年代dos系統,是乙個黑底白字字元介面,敲著鍵盤打著**是常態;隨後比爾蓋茨的windows震驚世界,乙個作業系統加上多工的視覺化視窗,可以讓溝通更簡單;十年前,賈伯斯告訴大家,人類其實有乙個天然的操作工具就是雙手,於是觸屏的iphone一代誕生;十年之後,人工智慧告訴我們,人和物的互動其實可以解放雙手。

阿里巴巴深諳其道,認為語音是最早最原始的資訊交流渠道,與影象、動作並為公認的三大互動方式。

而家居環境的屬性使得語音成為最合適的互動方式,智慧型語音應用主要圍繞智慧型電視、冰箱、音箱、家用機械人展開,解決的需求包括搜片、搜歌、提醒、簡單互動、應用調取等等。

細觀全球市場,亞馬遜並不是最早推出語音助手的,或者也不是在人工智慧領域的技術實力最強的,甚至在硬體產品的研發上並非第一,開發者生態建設更不是佼佼者,但echo的成功至少說明了兩點: 

1、這是乙個全新的市場;

2、除了技術實力和硬體研發製造能力之外,在語音助手領域,對後段商業和服務生態的整合能力決定了競爭的寬度,實則更高門檻。 

從這個角度反觀中國市場,如果以「智慧型音箱」這個品類看,毫無疑問**內容的豐富是最重要的,但如果是「智慧型語音助手」這個品類,對後端商業和服務的整合能力是關鍵。 

阿里的入局

說一聲「天貓精靈」,就可以召喚雲端的aligenie提供服務,播**、聽故事、講笑話、查運勢、玩遊戲、查天氣、找手機、問百科、設鬧鐘/定時器、充話費、查快遞、查**、天貓魔盒控制、智慧型家電操控,樣樣拿手,功能還將隨著開發者的入駐而增加。依靠阿里雲機器學習技術和計算能力,aligenie能不斷進化成長,越用越聰明。

「天貓精靈,蘋果的熱量是多少?」——「每一百克可食部分為54卡。」

「天貓精靈,我的手機在**?」——「正在搜尋你的手機。」

「天貓精靈,給我手機充值100元。」

「天貓精靈,買一箱可樂。」

……這一幕同樣發生在當天,天貓精靈x1首席產品體驗官、zealer中國創始人王自如和天貓精靈x1的互動場景,知無不言言無不盡的天貓精靈十分討喜。

天貓精靈x1和aligenie背後,由阿里巴巴人工智慧實驗室坐鎮,基於阿里語音識別、自然語言處理、人機互動等技術。其中,阿里人工智慧實驗室正在對聲紋識別、聲紋購、nlp中文對話引擎等核心技術申請專利。  

天貓精靈x1外觀圓柱形,有黑白兩種配色,直徑83公釐,頂部**配有一枚靜音鍵,一觸發此鍵,x1立刻暫停,以保證使用者隱私。x1底部設計一圈隱藏指示燈,會通過聲音判斷使用者方位,亮起燈光以示提醒,燈光還會根據不同使用功能和場景配合進行提示。 

配置方面,x1採用smartaudio專業處理晶元,相比此前市面上的主流晶元,處理效率提公升25%,功耗降低32%;搭載了6麥克風環形陣列,在家庭環境下支援5公尺範圍語音識別。 

x1還具備一定的自我學習功能,可以根據環境噪音進行優化,適應不同家庭環境噪音。 

考慮到中文語義環境的複雜性,阿里人工智慧實驗室通過眾包平台等方式,徵集生活中的各種生活場景所需要用到的語義問法,僅天氣預報就能夠理解786種中文問法,通過深度學習, x1已覆蓋20個領域的中文自然語義理解,能夠理解人類80%的意圖。 

這套語義理解系統還帶有記憶功能和總結歸納能力,加上模擬的「長期記憶」和「短期記憶」功能,更容易理解使用者。除此之外,阿里人工智慧實驗室還已經著手其他多個語種的研究。  

這背後是大量的資料積累,以及遠端計算能力的提公升。 

x1可以通過聲紋識別技術分辨家裡的每乙個人。淺雪介紹,聲紋識別技術是生物識別的重要識別手段之一,結合服務鏈多重安全機制,已達到商用的級別。這也是阿里在語音深度學習領域的核心技術之一。 

天貓精靈目前最多可以識別6個人的身份。通過個性化推薦,聲紋識別在辨別出使用者的身份後還能夠實現「千人千面」,根據每個人的喜好設定和推送不同的內容。 

比如,聲紋識別技術可以應用到一些購物場景中。使用者先將自己的聲音註冊後生成聲音密碼,與機器繫結後,確認開啟聲紋購功能。隨後,當說出 「幫我買一箱牛奶」這樣的需求時,天貓精靈會要求使用者跟著念一串隨機數字進行聲紋校驗,如果確認為使用者本人,天貓精靈會從使用者繫結的支付寶中進行扣款完成交易。  

aligenie開發者平台主要面向四種型別的開發者,包括內容開發者、應用開發者、智慧型家居開發商和硬體生產商。

(1)向應用開發者免費開放nlp語義理解、tts語音合成等多項自然語言處理技術。開發者既可以建立技能,為更多的語音使用者提供服務,也可以將自己的裝置接入雲端服務,獲取語音互動能力。 

按照阿里的邏輯,除了技術的開放外,生態的開放合作也重要。目前,天貓超市、菜鳥、keep等已推出基於天貓精靈x1的語音應用,使用者只需動動口就可以完成話費充值、購買商品、健身語音提示等服務,很快還將上線打車、叫外賣、叫保潔等服務。開發者可以自由發揮。

現場,阿里人工智慧實驗室也公布了首個硬體開放合作夥伴:將與國際玩具巨頭美泰合作探索其旗下主要核心ip的合作開發機會,如費雪、芭比、托馬斯和朋友等智慧型玩具。 

除了生態的開放合作,後續的場景植入也關鍵。阿里目前已經或正在拓展的行業解決方案涉及六個方面,包括兒童領域、酒店領域、家庭場景、to b其他商業場景、線下零售場景以及與其他顯示裝置結合的場景。 

天貓精靈x1於7月5日開始進行限量公測,8月8日將進行首批正式發售,定價人民幣499元。 

原文發布時間為:

2023年7月6日

人工智慧實戰2019BUAA 第一次作業 張有馳

專案 內容這個作業屬於哪個課程 人工智慧實戰2019 這個作業的要求在 第一次作業 我的github賬戶 zycmonster 我在這個課程的目標是 個人課程目標 這個作業在哪個具體方面幫助我實現目標 閱讀前人發布的教學 經驗部落格等,認識到利用部落格交流知識思想的重要性,以及通過部落格分享自己的學...

人工智慧 人類的二次進化

人工智慧近些年以可見的速度在發展,人類社會也正迎來一場新的變革。現在的人工智慧早在70,80年代就已興起,隨著雲計算,大資料的興起,人工智慧重新公升溫。我們現在看到的人工智慧其實離真正的人工智慧還很遠,例如人類在出生後,當他看到乙隻貓,周圍的人告訴他這是貓,但他在看到乙隻黃色的貓,周圍的人告訴他這個...

關於人工智慧的一些幻想

理論太枯燥了,以下是我平時的一些科幻構思,全是與人工生命有關的,因本人文筆太差,只能給出個草草的框架 注 前三個構思曾發表在96年第二期的科幻世界上 綁架當生命可能以資訊方式傳遞,隊長帶人在地底打算攔截敵方將領的中微子波,以實現綁架其之目的,但接收器壞了,最後隊長決定用自已的大腦來接收這個資訊,於是...