python獲取大檔案行數

2022-09-04 20:57:13 字數 536 閱讀 2488

背景:處理一些日誌或者請求資料時,幾百萬行的資料,有時候在做效能測試任務時估算出大概需要的詞表數,需要一定行數的資料,需要提前看下原始檔案大小,在這記一下,的確比較快

**如下:

# 獲取檔案行數,一塊一塊讀取

def get_file_lines(filepath):

with open(filepath, 'rb') as f:

count = 0

buf_size = 1024 * 1024

buf = f.read(buf_size)

while buf:

count += buf.count(b'\n')

buf = f.read(buf_size)

return count

# 用法

filepath = "/home/alisleepy/all_query"

lines = get_file_lines(filepath)

print "檔案行數:" + str(lines)

php快速獲取超大檔案行數的方法

start microtime true filesize filesize shuiping yang.log fp fopen shuiping yang.log r getfp fopen shuiping yang.log r lines 0 line 0 獲取檔案的一行內容,注意 需要ph...

python 獲取較大 csv檔案的行數

所謂較大.csv檔案,就是直接用pd.read csv讀取,會出現memoryerror.這時需要把檔案變成迭代器,分段讀取.user info pd.read csv e data analysis graduation design data weibo users.csv iterator t...

Python計算大檔案行數方法及效能比較

如何使用python快速高效地統計出大檔案的總行數,下面是一些實現方法和效能的比較。1.readline讀所有行 使用readlines方法讀取所有行 def readline count file name return len open file name readlines 2.依次讀取每行依...