IE LAB 如何在Linux上識別相同內容的檔案

2021-09-24 23:25:28 字數 2092 閱讀 3797

檔案副本有時會占用大量磁碟空間,如果要進行更新,可能會造成混淆。這裡有六個命令可以幫助您識別這些檔案

一、使用diff命令比較檔案

比較兩個檔案最簡單的方法可能就是使用diff命令。輸出將顯示兩個檔案之間的差異。《和》符號表示額外的行是否在作為引數提供的第乙個()檔案中。在此示例中,額外的行位於backup.html中。

如果diff顯示沒有輸出,則表示兩個檔案相同。

diff的唯一缺點是它一次只能比較兩個檔案,你必須識別要比較的檔案。我們將在本文中看到的一些命令可以為您找到重複的檔案。

二、使用校驗和

該校驗和(校驗)命令計算校驗和檔案。校驗和是將內容數學減少到乙個很長的數字(如2819078353 228029)。雖然不是絕對唯一,但是內容不相同的檔案導致相同校驗和的可能性非常小。

三、使用find命令

雖然find命令沒有查詢重複檔案的選項,但它可用於按名稱或型別搜尋檔案並執行cksum命令。例如:

四、使用fslint命令

該fslint命令可以用來專門查詢重複檔案。請注意,我們給它乙個起始位置。如果需要執行大量檔案,該命令可能需要相當長的時間才能完成。這是非常適度搜尋的輸出。請注意它如何列出重複檔案以及查詢其他問題,例如空目錄和錯誤id

您可能必須在系統上安裝fslint。您可能還需要將其新增到搜尋路徑中:

五、使用rdfind命令

該rdfind命令還將尋找重複的(相同內容的)檔案。該名稱代表「冗餘資料查詢」,該命令可以根據檔案日期確定哪些檔案是原始檔案 - 如果您選擇刪除重複項,這將有幫助,因為它將刪除較新的檔案。

您也可以在「dryrun」中執行此命令(即,僅報告可能以其他方式進行的更改)。

rdfind命令還提供諸如忽略空檔案(-ignoreempty)和跟隨符號鏈結(-followsymlinks)之類的選項。檢視手冊頁以獲取解釋。

請注意,rdfind命令提供了使用-deleteduplicates true設定刪除重複檔案的選項。

您可能必須在系統上安裝rdfind命令。嘗試使用它來熟悉它的工作方式可能是乙個好主意。

六、使用fdupes命令

該fdupes命令也可以很容易地識別重複檔案,並提供了大量有用的選項-像-r遞迴。在最簡單的形式中,它將重複檔案組合在一起,如下所示:

這是乙個使用遞迴的例子。請注意,許多重複檔案很重要(使用者的.bashrc和.profile檔案),顯然不應刪除。

fdupe命令的許多選項如下所示。使用fdupes -h命令,或閱讀手冊頁以獲取更多詳細資訊。

fdupes命令是另乙個您希望安裝和使用一段時間以熟悉其許多選項的命令。linux系統提供了很多用於定位和刪除重複檔案的工具,以及您希望執行搜尋的選項以及在找到重複檔案時要對其執行的操作。

文章節選自networkworld:

ielab老師:趙韶磊

如何在linux上安裝git

工作需要,要裝git,結果找不到源,後來搞定,記錄如下 1.linux el5 x86 64 1.1 我的這個版本上有yum,所以用yum來裝git,但是第一次裝找不到源,最後顯示 nothing to do 1.2 然後上網搜,說是要先裝epel 1.3 如何安裝epel?網上給出很多鏈結,但是可...

如何在linux上架設PPPoE server?

如何在linux上架設pppoe server?樂維up 0 李新天,it系統運維人員 在網上幾乎找不到相關的資料,反覆試驗了幾次沒有成功。有沒有大蝦冒出來指點一下?linux 網路 networking pppoe 分享 編輯 舉報 2012年02月27日 李新天最近編輯於 2012年02月27日...

如何在Linux上安裝Python

python現在是最流行 最常用的程式語言。python的簡單語法和低學習曲線使其成為初學者和專業開發人員的最終選擇。python還是一種非常通用的程式語言。從web開發到人工智慧,它幾乎在所有地方都得到使用,而在移動開發之外的其他地方都很少使用。如果您使用的是python,那麼您很有可能是一名開發...