Python通過MD5值實現重複檔案的檢測

2021-10-14 11:12:55 字數 838 閱讀 4913

平時上課時學生上機作業經常有直接複製別人的檔案,只修改檔名的抄襲情況,為了快速檢測這種問題,通過md5值簡單的寫了下,聊勝於無吧,有時間了寫乙個更完善的。

import hashlib

import os

from collections import counter

import sys

reload(sys)

sys.setdefaultencoding(『utf-8』)

def get_md5_01(file_path):

md5 = none

if os.path.isfile(file_path):

f = open(file_path,『rb』)

md5_obj = hashlib.md5()

md5_obj.update(f.read())

hash_code = md5_obj.hexdigest()

f.close()

md5 = str(hash_code).lower()

return md5

def get_md5_02(file_path):

f = open(file_path,『rb』)

md5_obj = hashlib.md5()

while true:

d = f.read(8096)

if not d:

break

md5_obj.update(d)

hash_code = md5_obj.hexdigest()

f.close()

md5 = str(hash_code).lower()

return md5

python 實現大檔案md5值計算

python 中使用hashlib模組實現常見摘要演算法,如md5 sha1等。hashlib.md5 檔案內容 實現了對檔案的md5計算,注意引數為檔案內容而不是檔案路徑。import hashlib with open 2.jpeg rb as f data f.read d5 hashlib....

Python實現計算MD5

本文章和我的部落格同時發布 厲害部落格 md5 是 message digest algorithm5 的縮寫,md5 是一種資訊摘要演算法。在平時的開發中可能要計算 md5,可是自己寫乙個演算法很麻煩,這時就可以使用 python 的內建模組 hashlib。hashlib 能計算 sha1 md...

python獲取檔案MD5值

在比較兩個資料夾內的兩個壓縮包是否相同,可以採用判斷兩個壓縮包的md5是否相等。md5也是有可能會判斷失誤的,了解一下md5碰撞演算法 python獲取檔案md5 import os import hashlib def get md5 filename if not os.path.isfile ...