「資訊指紋」是什麼

2021-08-29 19:39:23 字數 2284 閱讀 7023

一、資訊指紋的由來

資訊有「指紋」嗎?資訊要「指紋」做什麼呢?

「指紋」一般特指我們識別人所採用各種方式的乙個總稱。生活中我們需要辨認出周圍的每乙個人,即使是非常相似的雙胞胎,因為辨別是我們進行相互交流的前提。無論是通過名字、長相、聲音的辨認,還是通過有技術依據的指紋與虹膜辨認,甚至是通過 dna 鑑定,目的都只有乙個,就是能準確確認對方。

可見指紋的首要用途就是識別個體,當然作為指紋特徵,需要它是可唯一確定的、不容易更改的、方便攜帶的。另外乙個重要用途是檢索,我們需要找哪個朋友的時候,可呼叫他的名字找到他,也可以把他的指紋輸入電腦,很快就查詢到他的詳細資訊。

我們很容易聯想到 ca 證書的方式,在電子資訊中放入證書,具有防篡改和抗抵賴的功效,然而在普通的文件中,證書與資訊本身是很容易分離的,也就是說我只要資訊,拋棄證書,把一次「合法」得到的資訊,變成自己的,再進行 n 次複製發布,對資訊的擁有者來說,是個「頭痛」的問題。網際網路是乙個虛擬的世界,有些現實中的法律與道德規範很難落實,變化各種虛擬的身份在網際網路上就想玩遊戲一樣方便。所以資訊指紋不僅應該源自資訊,資訊改變了,指紋就能反應出來;而且還要廉價、容易實現。

從 另乙個需求角度講,在涉密資訊系統中,有一項重要的防護要求,就是高密級的資訊不能流向低密級保護的網路區域,但如何防護卻是個大問題。資訊中的密級標識 是很敏感的,只是在文件中標識,則很容易刪除或修改,標識被修改了,防洩密就成了問題。資訊指紋具有不可篡改的特性,把密級標識放在資訊指紋中,就很容易 通過密級過濾的「網路防火牆」,自動檢索出高密級資訊,防止資訊的洩密。

綜觀各種需求與目的,資訊不僅需要指紋,而且資訊指紋將是網際網路上「資訊海洋」的必然技術。

二、資訊指紋提取的幾種方法:

資訊按照其表徵特性可以分為:文字資訊、圖形資訊、影象資訊、語音資訊。按照其**可以分為:文件資訊 ( 正式編寫的資訊,有標題、作者、摘要、關鍵字等輔助資訊,如正式發表的文章、**等 ) 、自然資訊 ( 隨意記錄或編寫的資訊,只有資訊的內容,沒有或部分有輔助資訊,如八卦新聞、聊天室的帖子、部落格的文章等 ) 、再生資訊 ( 對各種資訊的統計資訊,或通過對別人資訊的重新編寫,總結、聯想出來的新資訊,一般再生資訊也都屬於文件資訊,有輔助說明資訊 )

因此文字資訊提取指紋的要素一般為下面資訊: n

標題 n

作者 n

發布時期、修改日期 n★★

作者提供的摘要,或整理人員編寫的摘要 ★

★文章開頭或結尾一段話 ★

文章中固定位置的一段話 ( 如第 5 行的第一句話 )

有了這些代表資訊後,便可以形成指紋資訊,若再對這些資訊進行 hash 運算、 md5 等方式加密、變化,生成一段定長 ( 如 256 位元組 ) 的資訊,就可以作為該資訊的「指紋」,經過加密主要是防止對資訊內容的篡改和對指紋的替換。這種方法有些象數字簽名技術,但要相對簡單,並且不進行加密運算時的標題等資訊可以直接作為檢索的關鍵字使用,

文字資訊的指紋提取不容易,對語音、影象指紋的提取就更困難了,因為對影象、語音的描述本身就比文字要麻煩。一般的思路是:在語音、影象先進行特徵編碼,也就是選取有代表意義的區域性,語音中的某段頻率 ( 人的聲音都有自己的音色特點 ) ,影象中的明暗對比強烈的地方、或關鍵影象的區域等,再對編碼進行變換、加密等處理,形成指紋。下面我們介紹乙個影象提取指紋的簡單方法:色階圖方法

色階圖 (color histograms) :就是從影象中產生出,可以描述影象的色彩分布。

影象與文字資訊不同,是以點陣的色彩存放,資訊量非常大,演算法的目的就是進行資訊簡化,具體步驟如下: 1.

大小:對影象進行切割,根據顆粒度不同,小塊大小為 m*n ,影象分割為 m*n 個塊 2.

模糊:對每個影象塊進行色彩的平均處理,也就是用該塊最多的顏色代表該塊 3.

減色:將色彩從真彩的 65536 色減少,合併顏色,當然顏色數量可以根據顆粒度選擇 8 色、 16 色、 256 色等,本例選擇為 8 色 4.

替換:簡化後資訊為 m*n*8 ,每個顏色用乙個字母符號替代,如:採用 xpm 格式,每個顏色用乙個字元表示:

b 對 black   . 對 blue     x 對 green    o 對 cyan 

o 對 red    + 對 magenta  @ 對 yellow   # 對 gray100 5.

編碼:把每個影象塊用其字母替代,再按順序排列,就形成乙個 m*n 的字串。該字串作為影象的指紋資訊。

三、小結

資訊指紋是資訊時代網際網路上的新興技術,目前還處於起步的階段,但隨著網際網路的繁榮,資訊指紋的未來前景是廣闊的。這裡只是簡單的介紹,給大家乙個思路,離理論**還相距甚遠。

「資訊指紋」是什麼

一 資訊指紋的由來 資訊有 指紋 嗎?資訊要 指紋 做什麼呢?指紋 一般特指我們識別人所採用各種方式的乙個總稱。生活中我們需要辨認出周圍的每乙個人,即使是非常相似的雙胞胎,因為辨別是我們進行相互交流的前提。無論是通過名字 長相 聲音的辨認,還是通過有技術依據的指紋與虹膜辨認,甚至是通過dna鑑定,目...

網路資訊推送是什麼

網路資訊推送是利用推送技術根據客戶需要,有目的 按時將感興趣的資訊主動傳送到使用者的計算機中,讓意向客戶或潛在客戶成為真正的客戶。如果關於網路資訊推送您還是不了解,那我就舉乙個例子 就像是廣播電台播音,推送技術主動將最新的新聞和資料推送給客戶,使用者不必上網搜尋。該行為的主要優點是對使用者要求低,普...

資訊指紋及其應用

摘自google黑板報 2006年8月3日 上午 11 17 00 發表者 吳軍,google 研究員 任何一段資訊文字,都可以對應乙個不太長的隨機數,作為區別它和其它資訊的指紋 fingerprint 只要演算法設計的好,任何兩段資訊的指紋都很難重複,就如同人類的指紋一樣。資訊指紋在加密 資訊壓縮...