siri 蘋果語音控制功能

2021-06-06 17:54:26 字數 4129 閱讀 9846

編輯本義項

求助編輯

百科名片

siri是蘋果公司在其產品iphone 4s上應用的一項語音控制功能。siri可以令iphone4s變身為一台智慧型化機械人,利用siri使用者可以通過手機讀簡訊、介紹餐廳、詢問天氣、語音設定鬧鐘等。siri可以支援自然語言輸入,並且可以呼叫系統自帶的天氣預報、日程安排、搜尋資料等應用。還能夠不斷學習新的聲音和語調,提供對話式的應答。

目錄siri讀音

技術**

功能相關技術

相關資訊

siri十大功用

siri,讀音為/siri./,更為體現其功能,漢語化,可以將其讀為「c瑞」。

siri技術**於美國國防部高階研究規劃局所公布的 calo計畫:乙個讓軍方簡化處理一些繁複庶務,並具學習、組織以及認知能力的數字助理,其所衍生出來的民用版軟體 siri 虛擬個人助理。

[1]siri所用到的技術,很多人會回答,人工智慧以及雲計算,的確,總體來說,是這兩樣技術,不過,這種概述感覺幾乎沒有任何意義,何不直接說「計算技術」(注意,不是計算機技術)呢。因此,在本文,我將介紹下我了解siri可能採用的技術(由於有個人猜測,不一定準確)。

首先,在前端方面,即面向使用者,和使用者互動(user inte***ce,ui)的技術,主要是語音識別以及語音合成技術。語音識別技術是把使用者的口語轉化成文字,其中需要強大的語音知識庫,因此需要用到所謂的「雲計算」技術。而語音合成則是把返回的文字結果轉化成語音輸出,這個技術理論上本地就能完成,但不知道siri是否如此,當然,在雲端完成也並無不可,在當前無線頻寬下,那點語音流量根本不算什麼。

[3]其次,後台技術,這些其實才是真正的大角色。這些技術的目的就是處理使用者的請求,並返回最匹配的結果,這些請求型別很多,千奇百怪,要處理好並不簡單。基本的結構猜測可能是分析使用者的輸入(已經通過語音轉化),根據輸入型別,分別採用合適的技術(合適的技術後台)進行處理。這些合適的後台技術包括,①以google為代表的網頁搜尋技術;②以wolfram alpha為代表的知識搜尋技術(或者知識計算技術);③以wikipedia為代表的

知識庫(和wolfram alpha不同的是,這些知識來自人類的手工編輯)技術(包括其他百科,如電影百科等);④以yelp為代表的問答以及推薦技術。

網頁搜尋技術[3]

知識計算(搜尋)技術(computational knowledge)[3]

這個技術的代表是wolfram|alpha。

不同於搜尋網際網路資訊,wolfram|alpha將從公眾的(包括公開的網頁等)和獲得授權的資源中,發掘、建立起乙個異常龐大的經過組織的資料庫,再利用高階的自然語言演算法進行處理,最終構造出乙個類似於谷歌搜尋的工具。

和網頁搜尋技術不同的是,在這個系統中,得到的答案結構化程度很高,比如搜尋china,能得到和中國相關的各種引數以及資料,並以接近**的方式呈現。wolfram|alpha也能理解部分自然語言,比如輸出how old are you,其會回答wolfram|alpha的年齡。想測試這項技術的請移步wolfram|alpha。

知識庫技術[3]

這名字是我自己起的,不知道有沒有貽笑大方……這個技術的代表是維基百科,以及各種專門的百科**。相比於網頁搜尋技術,基本以乙個詞條或者主題為單位,因此得到的資料價值高,知識量大,並且結構化程度好。相比於知識計算技術,這些技術需要人的參與,這有利也有弊,利就是,畢竟暫時人比機器聰明,編輯出來的知識更豐富,準確;弊就是,人力有限,即使像維基那樣,發動社群的力量,也不能產生足夠的知識,而知識計算,理論上,只需要演算法夠牛叉,是可以產生「無限」的知識的。

另外,寫到這裡,我想起yahoo和google的故事,當年,yahoo是搜尋老大,就像現在的wekipedia在知識搜尋領域一樣,而google是小弟,就像wolfram|alpha在知識搜尋領域一樣。但後來,卻反過來了,googe成了網頁搜尋老大,yahoo成了小弟,原因就是google相信演算法的結果,把所有事都交給演算法做,而yahoo,很多索引都是人工編輯的。我想,也許有一天,wekipedia和wolfram|alpha也會出現這樣的情況。

問答推薦技術

其實這不能稱為乙個技術,應該屬於知識庫的技術。不同的是,這個技術針對的是一些生活資訊,這些資訊的地域化程度很高,典型代表為yelp。由於這東西比較簡單,就不仔細介紹了。

其實在國內,這方面的**也有,那就是大眾點評網這些。

在iphone 4s的蘋果發布會中蘋果稱siri voice

原siri應用介面(現已下架)

[4]

為什麼要下架呢?這是可能是因為蘋果擔心第三方應用若能夠實現iphone 4s 的功能的話,會影響現有的iphone 使用者購買新iphone 的慾望,從而影響銷量。

[5]北京時間2023年10月15日訊息,據國外**報道,蘋果官網siri常見問題(faq)頁面稱,蘋果語音識別個人助理功能siri將在明年支援中文、日文、韓文、義大利文和西班牙文等更多語言。

目前siri支援英文、法文和德文的語音識別,其中英文部分只支援美國、英國和澳大利亞的口音,對於其他國家和地區的英語口音在識別上還存在困難。

此外,被蘋果定義為仍處在「測試階段」的siri目前支援在美國進行地圖和本地搜尋,不過蘋果官網的siri faq頁面也承諾,相關功能在2023年將拓展到其他國家。

1.siri變身鬧鐘

這應該是使用者最容易想到的siri的「正經」用法了。按住「home」鍵,告訴siri,「早上7點15的時候叫醒我」;想打會兒小盹,就說「40分鐘後叫醒我」。只要準確地報上時間,siri將是最好用的鬧鐘。

2.用siri尋找咖啡廳

喝咖啡是很多上班族的習慣,一杯咖啡能夠迅速地將人調整成工作狀態。出門在外的時候,想找個咖啡廳?利用siri就可以搞定這一切。告訴 siri,尋找離當前位置最近的咖啡廳即可。如果你沒有附加更多的要求,siri將反饋給還算不錯的答案,很可能是告訴你最近的星巴克在哪。如果星巴克還不能滿足你的要求,還是用更專業的應用yelp吧,它會給你更詳細的答案。

3.想去哪,siri告訴你

查詢出行路線的過程中往往要輸入不少文字。想省事的話,還是用siri完成這一切吧。報上要去的地點,siri會呼叫google地圖來尋找出行路線的方案。從測試過的這種用法的使用者的反饋上看,siri目前還沒有出過什麼差錯,就像gps那樣好使。

5.傳送簡訊,siri代勞

還在邊走路邊發簡訊?行路不安全不說,發簡訊還費勁,以後用siri代勞吧。走路的時候,將iphone放在耳邊,告訴siri「用簡訊告訴她,我將晚點到家」。不用匆忙,告訴siri你想表達的內容,即可輕輕鬆鬆地傳送簡訊。

6.天氣預報,siri知道

這也是siri十分擅長的一項功能。關於氣象資訊的問題,siri都能正確理解。想要知道明天的天氣怎樣,問問siri就知道了。

7.用siri提醒日程安排

既然能把siri當鬧鐘用,你當然可以用它來提醒日程安排。很多人都有使用google日曆的習慣,用google日曆安排自己的各項日程。生活中的一些需要提醒的小事,完全沒有必要一項項地加到google日曆中去,用siri就可以搞定這個問題。比如說,「十點鐘的時候,提醒我去刷牙」。

8.用siri提醒地點

siri提醒地點的功能目前還不是很完善。除了「家」或「上班處」,siri對於一些位置稱呼的理解能力不佳。但是,siri對「這裡」的理解十分準確,即當前的gps座標位置。所以你可以這樣用siri的提醒功能,途徑一家不錯的小店時,可以將它的位置標記為「這裡」並設定好提醒,以便日後有時間時再次光顧。

9.siri為你答疑解惑

珠穆朗瑪峰現在多高?美國去年的gdp是多少?回答不上來的話,無需google,張嘴問問siri吧。siri本身是不知道這些問題的答案的,它會從「知識問答引擎」wolfram alpha中尋找答案。所有的回答都會以自然語言的形式呈現。這也是siri被認為將對google重要威脅的原因。當然,siri在相當長的一段時間肯定不能取代google,但對google的威脅將是長遠的。當siri足夠智慧型的時候,人們用它取代 google並不是沒有可能。

10.用siri發推

如果你是twitter重度使用者,怎麼能錯過這個用法呢?不過在使用siri發推前,還得做一些必要的設定。

**:

siri語音功能測試點

是否開啟siri喚醒 都支援什麼語種 是否有喚醒siri無反應的情況 在無網路情況下,是否能使用siri 喚醒siri需要多久時間 喚醒siri是否馬上能做出反應 是否支援側邊按鈕喚醒siri 手機鎖定時是否支援喚醒siri siri是否支援女生播報和男生播報 在語速過快情況下是否能識別語音 在嘈雜...

蘋果收購語音應用開發商,或為Siri招兵買馬

siri因為智慧型問題一直備受詬病,這一問題,或將隨著收購智慧型語音應用開發商pullstring有所改善。2月16日,據外媒axios透露,蘋果將以低於1億美元的 收購位於舊金山的智慧型語音應用開發商pullstring,該公司可以設計 發布語音應用軟體,能夠幫助使用者開發訂製的會話式互動功能。據...

電腦生成siri語音 語音識別和語音合成技術

語音識別是指將人的說話的聲音轉換成相應的文字,這需要計算機自動識別出語音頻號中的單詞和詞彙,甚至理解其中所包含的意思。語音識別的應用面特別的廣泛,包括語音撥號,語音導航,裝置操作控制,語音文件檢索,聽寫資料錄入等,如果語音識別和機器翻譯以及語音合成技術相結合,還可以提供從一種語音到另外一種語音的計算...