時間相關性下的差異隱私量化

2022-06-27 13:48:13 字數 1163 閱讀 5453

原文傳送門【點選】

傳統的差分隱私機制,假設資料是獨立的,或者對手不了解資料相關性。但顯示世界中連續的生成的資料傾向於在時間上相關,並且這種相關性可以由對手獲取。本文研究在連續資料發布的背景下,事件相關性在傳統差分隱私機制的潛在隱私損失

首先,我們使用馬爾可夫模型對時間相關性進行建模,並在對手了解此類時間相關性時分析dp機制的隱私洩漏

我們的分析表明,dp機制的隱私丟失可能會隨著時間的推移而累積並增加。

我們稱其為暫時性隱私洩漏。

其次,為了測量這種隱私損失,我們設計了一種在多項式時間內進行計算的有效演算法。

儘管臨時隱私洩漏可能會隨著時間的推移而增加,但我們還表明,在某些情況下,其最高可能存在。

第三,為了限制隱私丟失,我們提出了一種機制,可以將任何現有的dp機制轉換為一種針對臨時隱私洩露的機制。綜合資料的實驗證實了我們的方法是有效的。

1)定義時間相關性下的差分隱私洩露(tpl)。tpl包括向後隱私洩露(bpl)和前向隱私洩露(fpl)兩部分,這是由於前向和後向時間相關的存在。我們的分析表明,bpl可能會由於以前的隱私洩漏而累積,而fpl會隨著未來的發布而增加。直觀地說,時間t的bpl受以前發布的資料的影響,時間t的fpl將受未來發布的影響。我們定義了時間相關下的α-差分隱私,表示為α- dpt,從而形式化了針對對手的dp機制的隱私保障,即時間隱私洩漏應以α為界。證明了α-dpt的乙個新的序列合成定理(不同於-dp傳統的序列合成)。

2)其次,我們有效地計算了給定的前向和後向時間相關性下的時間隱私洩漏量。我們將時間隱私洩漏的計算轉化為尋找線性分式規劃問題的最優解。這類問題可以用指數時間內的單純形演算法求解。通過利用這些約束條件,我們提出了乙個多項式時間演算法來精確地量化時間隱私洩漏。

3)第三,我們設計了私有資料釋放演算法,可以用來將傳統的dp機制轉換為滿足α-dpt的機制。乙個挑戰是時間上的隱私洩露可能會隨著時間的推移而增加,因此當釋放時間t的長度是未知的時候,α-dpt是很難實現的。在我們的第乙個解決方案中,我們證明了在某些情況下可能存在時間隱私洩漏的上限,在這些情況下,我們分配適當的隱私預算以確保無論t有多長,增加的時間隱私洩漏永遠不會大於α。但是,當t太短時,時間隱私洩漏的積累會導致顯著增加,我們可能會過度擾動資料。第二種解決方案是通過精細計算時間隱私洩漏量,精確實現每個時間點的α-dpt。

資料的相關性

載入資料 detail pd.read excel meal order detail.xlsx print detail n detail 對amounts 進行去重,拿到菜品的單價資料來評估這家餐廳的消費水平預估。相關性在 1,1 之間,0corr是負相關。method 預設是皮爾遜相關係數,相...

C語言的平台相關性,編譯器相關性

c 標準的 rationale 之一 優先考慮效率,而可移植性尚在其次。這就要求程式設計師非常清楚這些規則,如果你要寫可移植的 就必須清楚哪些寫法是不可移植的,應該避免使用。另一方面,寫不可移植的 有時候也是必要的,比如 linux 核心 使用了很多只有 gcc 支援的語法特性以得到最佳的執行效率,...

告警相關性的規則

1 相同事件相關法 相同事件指來自同一告警源 本系統中限定為同一ip位址 的相同型別的告警。其相關性處理方法即是將相同事件壓縮為一條告警,並累計告警次數,在最後的告警客戶端顯示出來。2 成對 相反事件相關法 相反事件指來自同一告警源的兩個告警資訊,乙個告警說明該位置上有某種型別的故障,另乙個告警說明...