KDD 20 如何建模網際網路水軍的對抗行為?

2021-10-25 07:57:48 字數 2805 閱讀 2686

dou, yingtong, guixiang ma, philip s. yu, and sihong xie.  (2020) "robust spammer detection by nash reinforcement learning." kdd'20.

引言深度長文:圖神經網路欺詐檢測方法總結

wsdm2018: 一種基於鄰居資訊的水軍發現演算法

利用有向圖模型檢測社交網路上的欺詐賬戶

文章:**:

背景

社交網路的出現孕育了基於社交網路的水軍,他們的形式和行為都更為豐富。

隨著社交網路和人工智慧技術的發展,最近幾年,水軍經常和假新聞,謠言等虛假資訊聯絡在一起。在一些虛假資訊傳播過程中,水軍扮演著重要的角色。

總而言之,通過大量同質行為或內容形成回聲室效應(echo chamber effect),從而影響其他使用者的觀點和決策,是社交網路水軍的最終目的。

本文介紹的這篇最新**主要關注評價系統的水軍,即大眾點評餐廳評價,還有**商品評價中的水軍行為。

下面我們分別介紹這篇文章的動機,方法,以及貢獻。

水軍的目標

在市場研究領域,有**已經用線性回歸建模了商品的聲譽和其收入的關係。

m. luca. 2016. reviews, reputation, and revenue: the case of yelp. com. hbs working ***** (2016).

實際效應可以用來表示水軍和平台在對抗過程中的實際目標(practical goals),假設水軍的目標是推廣目標商品,那麼平台的目標就是盡可能地減少推廣的程度。

對於檢測器來說,這樣的檢測目標和傳統機器學習中基於準確率和召回率的檢測目標不同,它更關注水軍的實際影響力

該文章也通過實驗證明,即使在召回率很高的情況下,水軍依然可以達到很高的推廣效果。

水軍的影響力

h. zheng, m. xue, h. lu, s. hao, h. zhu, x. liang, and k. ross. 2018. smoke screener or straight shooter: detecting elite sybil attacks in user-review social networks. ndss (2018).

根據之前提到的回聲室效應,有大 v 賬戶參與的水軍活動能夠讓使用者和平台更加信任,更容易影響其決策和演算法。

水軍與平台的博弈

除了上文提到的水軍實際目標和影響力的問題,這篇文章另乙個動機是水軍的靈活性,即水軍會隨時調整自己的策略來逃避平台的檢測。所謂道高一尺魔高一丈。

但是,許多之前的工作中只假設乙個靜態的檢測場景,其提出的檢測器只能檢測某一種特定型別的水軍。如下圖所示,對於乙個固定的檢測器 (fraudar),不同攻擊策略產生的實際影響不同。

基於水軍和平台的實際目標,這篇文章用博弈論中的 minimax game 建模了水軍和平台(防禦方)的對抗行為

對於水軍這一方,其控制一系列賬戶,有不同的攻擊策略;對於平台這一方,其擁有各種各樣的檢測器。

這種攻防的形式類似於現實世界中風控平台和黑產之間的博弈行為,雙方都在不斷公升級自己的**庫。

下圖的上半部分(challenges)就演示了水軍和平台之間的一**防過程。

訓練更穩定的檢測器

基於上面的博弈模型,該**進而提出了一種對抗訓練方法 (上圖下半部分)。

這種對抗訓練方法基於攻擊的實際效果,利用強化學習方法,同時更新攻擊策略和檢測器的引數,通過多輪的對抗訓練,最終攻擊方和檢測方達到納什均衡,即雙方都不願意改變自己的策略,因為改變策略後的收益很小

具體來說,對於攻擊方(水軍),該文章將其攻擊行為及獲取反饋的方式通過多臂賭博機(multi-armed bandit)建模, 因為攻擊方不知道平台的檢測機制,只能通過平台的反饋來確定自己攻擊的效果。

攻擊方通過平台的反饋來優化自己的策略,對於實際效應比較低的攻擊策略,攻擊方會降低其使用的次數,同理,對於實際效應比較高的攻擊策略,在下一**擊中,攻擊方會增加使用其的概率。

該文章使用強化學習常用的策略梯度(policy gradient)方法來更新不同檢測器的權重引數。

作者將這一套對抗訓練的方法稱為nash-detect演算法。

實驗及結論

該文章在三個不同規模的 yelp 虛假評價資料集上訓練和驗證了 nash-detect 演算法。實驗證明 nash-detect 能夠找到最優的檢測器引數,而且具有很好的穩定性和解釋性。

該文章同時提到,我們在訓練時,應該盡可能地考慮到各種攻擊和防禦的策略,這樣得到的模型在部署時才會有更好的穩定性。

往期文章:

什麼是網際網路?網際網路如何運作?

網際網路是乙個互聯計算機網路的全球系統,它使用網際網路協議套件 tcp ip 連線全球數十億臺裝置。它是乙個由數百萬個本地到全球範圍的私人 公共 學術 商業和 網路組成的網路中的網路,通過廣泛的電子 無線和光纖網路技術相互連線。網際網路承載廣泛的資訊資源和服務,例如互聯超文字文件和全球資訊網 www...

mysql 網際網路 MySQL網際網路業務使用建議

一 基礎規範 表儲存引擎必須使用innodb 表字符集預設使用utf8,必要時候使用utf8mb4 解讀 1 通用,無亂碼風險,漢字3位元組,英文1位元組 2 utf8mb4是utf8的超集,有儲存4位元組例如表情符號時,使用它 禁止使用儲存過程,檢視,觸發器,event 解讀 1 對資料庫效能影響...

網際網路與網際網路的區別

網際網路的英文單詞是 internet,網際網路的英文單詞是 internet。在英語中,專有名詞首字母都是大寫,用於特指某一事物。大寫的 internet 是作為乙個專有名詞出現的,所指的是由阿帕網發展而來的現如今全球最大的計算機網路,稱之為網際網路。小寫 internet 是作為乙個普通單詞出現...