ML對抗攻擊

2022-04-28 20:51:14 字數 977 閱讀 9904

記錄一下李巨集毅機器學習課程關於對抗攻擊的內容;

1、一般模型training過程

輸入x_0,調整模型network的引數θ,使得輸出y_0和y_true的loss越小越好;損失函式:l_train(θ) = c(y_0, y_true)

non-targeted attack

固定模型network的引數θ,調整輸入x',使得輸出y'和y_true越遠越好;損失函式:l(x') = -c(y', y_true)

targeted attack:

固定模型network的引數θ,調整輸入x',使得輸出y'和y_true越遠越好,同時讓y'和某個y_false越近越好; l(x') = -c(y', y_true) + c(y',y_false)

constraint:

常見的有兩種約束,l2-norm和l-infinity

1)l2-norm

d(x_0, x') = ||x_0 - x'||2

= (δx_1)2+ (δx_2)2+ (δx_3)2+...

2) l-infinity  

d(x_0, x') = ||x_0 - x'||∞

=max

how to  attack

x* = min l(x') st d(x_0, x') ≤ ε

大部分attack只是用不同的距離來作為約束, 以及用不同的優化方法來最小化這個距離

defense

passive defense:finding the attached image without modifying the model

proactive defense: training a model that is robust to adversarial attack

初探對抗攻擊 黑盒攻擊 白盒攻擊

對抗攻擊概念 通過對輸入新增微小的擾動使得分類器分類錯誤,一般用於對深度學習的網路的攻擊演算法 最為常見,應用場景包括目前大熱的cv和nlp方向,例如 通過對新增精心準備的擾動雜訊使得分類錯誤,或者通過對乙個句子的某些詞進行同義詞替換使得情感分類錯誤。關於攻擊的型別有很多種,從攻擊環境來說,可以分為...

用 iptables 對抗 CC 攻擊

我們可以使用 iptables 來在一定程度上實現 黑洞 抗 cc 連線耗盡 攻擊的能力,詳細配置如下 1.系統要求 1 linux 核心版本 2.6.9 42 elsmp 或 2.6.9 55 elsmp 其它核心版本需要重新編譯核心,比較麻煩,但是也是可以實現的 2 iptables 版本 1....

攻擊對抗基礎知識

對抗攻擊基礎知識,主要是對抗方法 對抗方法 fgsd fast gradient sign method 一種基於梯度生成對抗樣本的演算法 fgm fast gradient method 對fgsd做了推廣,使其能夠滿足 l2約束 ifgsd iterative gradient sign met...