差分隱私及應用

2021-09-26 02:21:21 字數 1706 閱讀 5380

差分攻擊是通過比較分析有特定區別的明文在通過加密後的變化傳播情況來攻擊密碼演算法的。差分攻擊是針對對稱分組加密演算法提出的攻擊方法,看起來是最有效的攻擊des的方法(之所以說看起來,是因為差分攻擊需要很大的空間複雜度,實際上可能不如野蠻攻擊具有可操作性)。2023年以前,差分攻擊就被證明對md5的一次迴圈是有效的,但對全部4次迴圈似乎難以奏效。但是隨著對md5研究的進展,情況有了變化。

2023年,王小雲、來學嘉等使用差分攻擊的思路,提出了對md5差分的攻擊方法。該方式提出了充分條件的概念,並列出了一系列的充分條件(大約有290個),如果這些充分條件都能得到滿足,那麼一定能產生碰撞。於是md5的強抗碰撞性不能得到滿足,即該攻擊方法可以尋找訊息對 ,使得 。不過,這一系列的充分條件很難同時滿足。儘管王小雲、來學嘉等進一步提出了訊息修改演算法,通過修改相應位元位的方法來達到滿足這一系列充分條件,但是仍然有37條充分條件不能滿足。這就意味著,從理論上來講,該演算法只需測試 條隨機訊息就可以找到完全滿足充分條件的訊息對 ,從而找到碰撞,即 。這是乙個相當有意義的成果,意味著任何人在自己的筆記本上都可以計算出碰撞的訊息對。當然,這裡產生碰撞的訊息對是隨機的。

差分隱私是dwork在2023年針對統計資料庫的隱私洩露問題提出的一種新的隱私定義。 在此定義下,對資料集的計算處理結果對於具體某個記錄的變化是不敏感的,單個記錄在資料集中或者不在資料集中,對計算結果的影響微乎其微。所以,乙個記錄因其加入到資料集中所產生的隱私洩露風險被控制在極小的、可接受的範圍內,攻擊者無法通過觀察計算結果而獲取準確的個體資訊。

差分隱私保護模型的思想源自於乙個很樸素的觀察:當資料集d中包含個體alice 時,設對d進行任意查詢操作f(例如計數、求和、平均值、中位數或其它範圍查詢等)所得到的結果為f(d),如果將alice 的資訊從d中刪除後進行查詢得到的結果仍然為f(d),則可以認為,alice 的資訊並沒有因為被包含在資料集d中而產生額外的風險。差分隱私保護就是要保證任乙個體在資料集中或者不在資料集中時,對最終發布的查詢結果幾乎沒有影響。具體地說,設有兩個幾乎完全相同的資料集(兩者的區別僅在於乙個記錄不同),分別對這兩個資料集進行查詢訪問,同一查詢在兩個資料集上產生同一結果的概率的比值接近於1。

具體的公式定義可以參見:

差分隱私保護模型假設攻擊者能夠獲得除目標記錄外所有其它記錄的資訊,這些資訊的總和可以理解為攻擊者所能掌握的最大背景知識。在這一最大背景知識假設下,差分隱私保護無需考慮攻擊者所擁有的任何可能的背景知識,因為這些背景知識不可能提供比最大背景知識更豐富的資訊。

它建立在堅實的數學基礎之上,對隱私保護進行了嚴格的定義並提供了量化評估方法,使得不同引數處理下的資料集所提供的隱私保護水平具有可比較性。因此,差分隱私理論迅速被業界認可,並逐漸成為隱私保護領域的乙個研究熱點。

差分隱私的弱點其實很明顯:由於對於背景知識的假設過於強,需要在查詢結果中加入大量的隨機化,導致資料的可用性急劇下降。特別對於那些複雜的查詢,有時候隨機化結果幾乎掩蓋了真實結果。這也是導致目前應用不多的乙個原因。

差分隱私可以被應用於推薦系統、網路蹤跡分析、運輸資訊保護、搜尋日誌保護等領域。

google利用本地化差分隱私保護技術從chrome瀏覽器每天採集超過1400萬使用者行為統計資料。在2023年wwdc主題演講中,蘋果工程副總裁craig federighi宣布蘋果使用本地化差分隱私技術來保護ios/macos使用者隱私。根據其官網披露的訊息,蘋果將該技術應用於emoji、quicktype輸入建議、查詢提示等領域。例如,count mean sketch演算法(cms)幫助蘋果獲得最受歡迎的emoji表情用來進一步提公升emoji使用的使用者體驗。

差分隱私保護及其應

差分隱私 python 差分隱私

差分隱私的由來 想要在乙個統計資料庫裡面保護使用者的隱私,那麼理想的隱私定義是這樣的 訪問乙個統計資料庫而不能夠洩露在這個資料庫中關於個人的資訊。也就是說統計資料庫應該提供乙個統計值,但是對於個人的資訊不應該被查詢到。但是,這個理想的定義是不可行的,它並沒有考慮到輔助資訊。比如這麼乙個例子 乙個關於...

差分隱私應用與展望

如何設計乙個滿足差分隱私的演算法?一般做法 從乙個不滿足差分隱私的演算法出發,往演算法裡適當地加入一定噪音,以使其輸出滿足差分隱私的要求。假設我們有乙個病患資料集d,考慮以下資料庫查詢 如果我們要發布這個查詢結果,如何才能滿足 epsilon 差分隱私?我們首先考慮這個查詢結果有多依賴於某個特定病人...

差分隱私學習

差分隱私 是對統計資料庫洩漏問題提出的新的隱私定義。在此定義下,對資料集的計算處理結果對於具體某個記錄的變化是不敏感的,單個記錄在資料集中或者不在資料集中對計算結果影響微乎其微。所以,一 個記錄因其加入到資料集中所產生的隱私洩露風險 被控制在極小的 可接受的範圍內,攻擊者無法通過 觀察計算結果而獲取...