如何設計乙個不討人厭的AI?「恐怖谷」了解一下

2021-09-20 11:10:07 字數 3500 閱讀 9282

隨著ai時代的到來,越來越多的智慧型裝置進入了我們的生活。它們在給我們帶來更多功能和便利的同時,也被賦予了更多「人性化」的特徵,比如能說會動,有人格有情緒,甚至會思考。

面對這麼多越來越「像人」、越來越「智慧型」的裝置,人們會產生什麼樣的感受呢?是喜歡還是反感,是接受還是擔憂?

這就涉及到我們今天要介紹的理論「恐怖谷」。

什麼是「恐怖谷」?

大家有沒有過這樣的經歷?當你在看一些動畫電影中的角色,比如《冰雪奇緣》中的elsa公主,你會覺得她很美麗,很吸引人。

而當你看一些科幻電影中的角色,比如《最終幻想:靈魂深處》的女主角aki,你會覺得乍一看人物形象還挺逼真的,但總覺得動作表情有些僵硬,給人怪怪的,不太舒服的感覺。

這是為什麼呢?其實可以通過「恐怖谷」的理論來進行解釋。

「恐怖谷」理論最早是2023年由日本機械人專家森政弘提出的,當機械人與人類的相似度極低(如圖,工業機械人)時,人們對它沒有太多的情感反應。

當這些非人的物體開始被賦予一些人類的特徵,在外形和動作上同人類逐漸接近時(如圖,人形機械人),人們對它的親近感和好感度會逐漸增加。

但當它與人類相像超過一定程度,人們對它的好感反而會下降,呈現乙個情感反應的低谷,即「恐怖谷」。

當它與人類的相似度繼續上公升,人們對它的好感會再次回到正面。

「恐怖谷」效應是如何產生?

解釋「恐怖谷」效應成因的角度很多,這裡主要介紹最核心的三種。

一種解釋是「認知失調」。

簡單來講,就是「預期」和「真實」情況不一致導致認知衝突。當類人物體和人類的相似度很高時,我們潛意識裡會把它視為我們的一員,而對於我們人類來講,每天接觸各種各樣的人,人是什麼樣子的,能長成什麼樣子,應該有怎樣的動作表情,我們都很清楚。

當它有任何不像人的地方時,我們很容易就能察覺,並和我們本來的預期產生了矛盾,我們無法馬上解決這種矛盾時,內心的不舒適甚至不安和恐懼就發生了。

2023年,加州大學聖地牙哥分校的認知科學家艾斯•塞金(ayse saygin)通過腦成像實驗發現,人們在****機械人的活動影像時,大腦與運動感知相關的區域活動會比**人類和普通機械人更加活躍。(如圖)

因為當我們看普通機械人和人類活動時,他們的外觀會幫助我們提前**他們的運動方式,而實際看到的結果就如我們預期的一樣。

**機械人卻不同,他們外觀酷似人類,動作卻和機械人相同,這在我們頭腦中造成了與預期不符的矛盾,從而要調動更多的大腦區域來協調這些矛盾。

這一結果正好可以佐證「認知失調」這一解釋。

還有一種解釋是「共情抑制」。

即當我們看到乙個既像人又不像人的個體時,無法很好地感受和理解對方的情緒和情感狀態,我們的「共情」能力出現了障礙,這讓我們感覺很不舒服。

結果顯示,當志願者看到擬人程度很高的角色時,腦中負責心理化(mentalizing)的區域活動會明顯增強。

所謂心理化,包含理解他人情感的能力。這一區域活動增強說明人們在理解那些高擬人程度角色的情緒/情感時出現了困難,這在一定程度上支援了「共情抑制」的解釋。

也有一些研究人員會從「進化選擇」的角度進行解釋,指出人類會從本能上排斥那些看起來不太正常的、病態的個體,以此來保護自己,而這些不正常、病態的特徵通常都是由面部和肢體表現出來的。

所以當我們看到那些看似逼真,卻面色慘白、表情僵硬、動作機械的**機械人時,會不自覺地聯想到「不健康」、甚至「死亡」,這時候就會產生不適、反感甚至恐懼的感覺。

我們前面說的「恐怖谷」理論基本都是圍繞著外表和動作的視覺感知層面,而隨著ai時代的到來,人們越來越多地使用語言直接和一些智慧型裝置進行對話。

「機器的語言」是否也存在「恐怖谷」?

有研究者嘗試探索過在聲音的自然度方面是否存在「恐怖谷」效應,發現在當時的實驗條件下,聲音的自然度方面,並不存在「恐怖谷」效應。

2023年,捷克皮爾森西波西公尺亞大學應用科學系的研究人員,曾**過在語音對話系統中tts(通過技術的手段把文字轉成語音)和「恐怖谷」之間的關係。

他們讓30名受試者(大學生,覆蓋技術和人文學科背景)分別同ai語音互動系統進行兩段對話,分別對應tts合成的兩種聲音,機器化的聲音(聲音a)和自然度高的聲音(聲音b),然後讓受試者評價對兩種聲音及兩段對話的喜好度。

結果發現,近3/4的使用者更喜歡自然度高的聲音(聲音b),且技術學科背景的學生喜歡聲音b的比例更高。

除了聲音的自然度,如果人們還能從「機器的語言」中感受到類人的情緒/情感,性格特徵,邏輯思考及解決問題等能力時,是否會產生「恐怖谷」效應呢?

下面這個研究,可以從一定程度上給我們一些啟示。

2023年,德國開姆尼茨工業大學的心理學家斯坦(jan-philipp stein)和奧勒(peter ohler)做過乙個實驗,他們讓被試通過vr**一支3d影片,裡面是一對男女正在進行一小段對話,整段對話包含多種情緒/情感狀態,兩人先是提到燥熱的天氣讓人昏昏欲睡,接著女人開始抱怨她擁有的自由時間太少,而且那個還不出現的遲到朋友讓她覺得很困擾,與此同時,男人在對話中會對女人的處境展現同情。

受試者分為4組,每組看的內容一模一樣,不同的是被告知對話產生的方式不一樣。

研究者告訴組1和組2的受試者,這段對話是兩個真實的人在說話,其中組1的對話內容是提前設計好的,而組2則是現場自主產生的。

而組3和組4的受試者,則被告知其實是電腦在後台控制著螢幕上兩個人的對話,只不過組3的對話內容是提前設計好的,而組4是自發產生的。

結果發現,組4(被告知對話是由電腦操控且自主產生)的受試者表示他們在**影片時會有特別怪異的感受。

研究人員認為,這可能是因為當他們覺得電腦是主動表現出同情、困擾等情緒/情感時,會覺得不安,甚至恐懼,擔心人類的獨特性和掌控權會受到威脅。

從以上可以看出,對於「機器的語言」,在聲音的自然度方面並不存在「恐怖谷」效應;而當聲音帶有情緒/情感時,則會觸發「恐怖谷」效應。

目前「恐怖谷」理論比較多地被應用於影視、動畫、遊戲製作領域,也出現了不少跌入「恐怖谷」的失敗案例。

如開篇提到的《最終幻想:靈魂深處》中的女主角aki。

還有好萊塢電影《極地特快》,全球第一部全部使用數字捕捉技術的高**動畫電影,其人物角色逼近真人,卻招致不少批評聲,有人說它給人一種毛骨悚然的感覺,有人覺得人物形象有點像殭屍,甚至有人認為這部**應該起名為「活死人之夜」……

如何避免跌入「恐怖谷」?

目前來看,比較有效的方式是不挑戰「恐怖谷」,止於谷前,消除 「似是而非」的狀態,明確非人的特徵。

其中,最常見的手段是風格化,通過藝術處理來告訴玩家,眼前的事物是虛擬的或者是非人類的。一旦玩家接受了這個設定,他們身上所具有的人的特徵就會特別迷人。

風格化的具體表現形式可以有很多:比如說**渲染風格(如《冰雪奇緣》、《超人總動員》),哥特陰鬱風格(如《殭屍新娘》、《尋夢環遊記》),面部藝術化處理(如《最終幻想15》)等。

其中值得一提的是《阿凡達》,它首先給予納威人乙個「外星人」的設定,使觀眾從心理上就不會把他們當作人來看待,同時通過非常態的表現,重新設計了納威人的表情、動作和語言文化表現,讓納威人「外星人」的特點更加突出逼真。

對於目前已經在我們生活**現以及未來還會大量出現的各種智慧型裝置,我們在設計它們的時候,在希望它們變得越來越「像人」、越來越「智慧型」的時候,應該也要同時考慮到這樣會不會引發 「恐怖谷」效應,要有意識地去規避這種效應。

這是我們每個關心人工智慧,關心這個行業發展的人都需要去注意的乙個問題。

原文發布時間為:2018-06-4

如何設計乙個優秀的API

到目前為止,已經負責api接近兩年了,這兩年中發現現有的api存在的問題越來越多,但很多api一旦發布後就不再能修改了,即時公升級和維護是必須的。一旦api發生變化,就可能對相關的呼叫者帶來巨大的代價,使用者需要排查所有呼叫的 需要調整所有與之相關的部分,這些工作對他們來說都是額外的。如果辛辛苦苦完...

如何設計乙個良好的介面

在設計介面時,有很多因素要考慮,如介面的業務定位,介面的安全性,介面的可擴充套件性 介面的穩定性 介面的跨域性 介面的協議規則 介面的路徑規則 介面單一原則 介面過濾和介面組合等諸多因素,本篇文章將簡要分析這些因素。一 規範性建議 1.職責原則 在設計介面時,必須明確介面的職責,即介面型別,介面應解...

如何設計乙個優秀的API

判斷乙個api是否優秀,並不是簡單地根據第乙個版本給出判斷的,而是要看隨著時間的推移,該api是否還能存在,是否仍舊保持得不錯。槽糕的api介面各種各樣,但是好的api介面對於使用者來說必須滿足以下幾個點 易學習 有完善的文件及提供盡可能多的示例和可copy paste的 像其他設計工作一樣,你應該...