觀色知喜怒 麻省理工成功開發情緒解讀機器學習模型

2021-08-21 18:45:17 字數 2290 閱讀 6712

麻省理工**實驗室的研究人員開發出一種機器學習模型,它能讓計算機像人一樣自然地解讀我們情緒。該模型能更好地捕捉細微的面部表情變化,從而更好地判斷情緒。通過額外的資料訓練,該模型在全新的人群中也能達到相同效果。

在不斷發展的「情感計算」領域,用於分析面部表情、解讀我們的情緒、並做出相應反應的機械人和計算機不斷被開發出來。例如一些應用,包括:監測個人健康、觀察學生上課的興致、輔助診斷疾病病徵,以及開發陪伴型機械人。

由於各種因素,人們表達情感的方式完全不同,這給情感計算帶來一大挑戰。文化、性別和年齡的不同,造成了這種普遍的差異。但其它的差異則更為細緻:時間、睡眠狀況、甚至你對交談物件的熟悉程度,都會導致你在特定時刻表達快樂或悲傷的方式發生細微的變化。

人類的大腦可以本能地捕捉到這些偏差,但機器卻不行。近年來,深度學習技術的發展幫助人們理解了其中的微妙之處,但這些技術在不同的人群中仍不準確且適應性不強。

**實驗室的研究人員現已開發出一種機器學習模型,它在捕捉這些細微的面部表情變化時超越了傳統系統。為了更好解讀情緒,已在該模型上訓練了數千張人臉影象。此外,通過額外的資料訓練,這個模型在全新的人群中也同樣有效。其目的是改進現有的情感計算技術。

「它以不引人注目的方式來監控我們的情緒,」oggi rudovic 說:「如果想讓機械人具有社會智慧型,就必須讓它們像人一樣自然地對我們的情緒作出反應。」oggi rudovic 是**實驗室的研究員,也是此**的合著者,該**上週在 mldm(機器學習與資料探勘)會議上發表。

**的共同作者有:第一作者 michael feffer,電氣工程和電腦科學的本科生;rosalind picard,**藝術與科學的教授,情感計算研究小組的創始人。

個性化的『專家』

傳統的情感計算模型採用「一刀切」的概念。他們訓練一組描述各種面部表情的影象,優化特徵——比如微笑時嘴唇如何捲曲——並把這些特徵對映到一組全新的影象中。

而在本文的研究中,研究人員將「多專家模型」(moe) 技術與模型個性化技術結合在一起,這種技術有助於從個體中挖掘出更細粒度的面部表情資料。rudovic 說,這是首次將兩種技術結合到一起進**感計算。

在「多專家模型」中,許多被稱為「專家」的神經網路模型被訓練成專門處理乙個單獨任務並產生乙個輸出。研究人員還加入了乙個「門限網路」,計算出哪位「專家」能最好地檢測到未被發現的受試者的情緒。feffer 說:「網路基本可以區分個體,並指出『這是給定影象的正確專家』。」

每個專家和門控網路都在殘差網路(resnet,用於分類的神經網路)的幫助下跟蹤每個人的面部表情。在此過程中,模型根據情緒效價(高興或難過)和情緒喚醒(興奮)程度——對不同情緒進行編碼的指標——對每一幀進行評分。另外,六名人類專家給每一幀情緒效價與喚醒做了標註,標註打分範圍從-1(低)到 1(高),此模型也會被用於訓練。

「這顯示了模型在資料很少的情況下,從人群到人群或者從個人到個人的適應能力。」rudovic 說,「這是關鍵,當出現新的人群時,必須要有方法來解釋資料分布的變化(微表情變化)。乙個模型分析一種文化下的表情時,它也需要適應不同的文化。如果不考慮這種資料轉移,模型就會表現不佳。但如果只是從一種新的文化中抽取一些樣本來適應我們的模型,那這些模型可以做得更好,尤其是在個人層面上。這就是模型個性化最重要的地方。」

當前可獲得的情感計算研究資料在膚色方面不夠多樣,因此研究者的訓練資料受到限制。如果可以獲得更多樣的資料,訓練後的模型就能用於更多元的人群。fetter 表示,下一步就是在「乙個包含多元文化的更大資料集」上訓練模型。

更佳的人機互動

研究者表示,另乙個目標是訓練模型,幫助計算機和機械人從少量變化的資料中自動學習,以更自然的方法對人的情感進行檢測,從而更好地滿足人類需求。

另外,這也有助於監測抑鬱症或痴呆症,因為人們的面部表情會因為這些情況而發生微妙的變化。rudovic 說,「我們可以通過長期監控使用者的表情來為他們定製個性化模型,並監控他們每天有多少偏差——偏離了面部表情的平均水平——並將其用作健康和幸福的指標。」

rudovic 說,比較有前景的應用是人機互動,如個人機械人或教育機械人,機械人需要適應評估很多人的情緒狀態。例如,有一種版本被用來幫助機械人更好地解讀自閉症兒童的情緒。

roddy cowie 是貝爾法斯特女王大學心理學名譽教授,同時也是一位情感計算學者,他表示,mit 的研究「說明了這個領域的研究現狀」。「我們正慢慢打造乙個系統,這個系統可以從面部**判斷出人們的情緒,從非常積極到非常消極,從非常主動到非常被動。直觀說來,乙個人給出的情感訊號與另乙個人的不同,因此當我們使情感識別個性化時,它能更好地工作,這很有意義。個性化方法反映出另乙個有趣的點,即訓練多個『專家』並綜合它們的判斷比訓練乙個單獨的超級專家要更加有效。二者合在一起可以構成乙個令人滿意的組合。」他說。

產業麻省理工

機器學習

人機互動

麻省理工的「黑客醫學」計畫

醫療行業非常害怕洩露資料和違反健康保險流通與責任法案,對 黑客 一詞也是諱莫如深。然而,這個詞在美國麻省理工學院卻是個褒義詞,有著不同的含義。多年來,麻省理工學院的技術通學生們發揮自己的創造力,發揚尋根究底的精神,形成了一種 黑客文化 黑客也確實可以在改善醫療水平上發揮一技之長。玩兒似地挑戰難事,不...

麻省理工(MIT)牛人解說數學體系

於是,我決心開始深入數學這個浩瀚大海,希望在我再次走出來的時候,我已經有了更強大的 去面對這些問題的挑戰。我的遊歷並沒有結束,我的視野相比於這個博大精深的世界的依舊顯得非常狹窄。在這裡,我只是說說,在我的眼中,數學如何一步步從初級向高階發展,更高階別的數學對於具體應用究竟有何好處。二 集合論 現代數...

麻省理工公開課 線性代數

矩陣右乘代表對列向量線性組合。左乘表示對行進行線性組合。ab c c中的列是a中列的線性組合,c中的行是b中行的線性組合。求方程可看做求線性組合的向量,採用消元法,把曾廣矩陣化成下三角,然後回代。方陣,只要有逆,放哪邊都行。非方陣,左逆不等於右逆。矩陣不可逆,可認為存在列的線性組合違為零。求逆的過程...