python正則操作大檔案

2021-10-12 07:23:07 字數 1380 閱讀 3298

開啟檔案的模式說明

開啟檔案的模式有(預設為文字模式):

模式 說明

修改檔案內容方法一

import os

with

open

('a.txt'

)as read_f,

open

('.a.txt.swap'

,'w'

)as write_f:

data=read_f.read(

)#全部讀入記憶體,如果檔案很大,會很卡

data=data.replace(

'test'

,'test2'

)#在記憶體中完成修改

write_f.write(data)

#一次性寫入新檔案

修改檔案內容方法二

硬碟存放的該檔案的內容一行一行地讀入記憶體,修改完畢就寫入新檔案,最後用新檔案覆蓋原始檔;

'''

'''import os

with

open

('a.txt'

)as read_f,

open

('.a.txt.swap'

,'w'

)as write_f:

for line in read_f:

line=line.replace(

'test'

,'test2'

) write_f.write(line)

os.remove(

'a.txt'

)os.rename(

'.a.txt.swap'

,'a.txt'

)

正規表示式

介紹

正規表示式是對字串操作的一種邏輯公式,就是用事先定義好的一些特定字元以及這些特定字元的組合,組成乙個「規則字串」,這個規則字串用來表達對字串的一種過濾邏輯;

特點

a.邏輯性、靈活性和功能性非常強;

b.可以迅速用極簡的方式達到字串的複雜控制;

c.對於剛接觸的人來說,比較晦澀難懂

場景

正規表示式的規則:

制定好正規表示式的規則,然後從指定的字串中找到符合規則的子串;

python中的正規表示式分類

a.元字元  b.模式  c.函式  d.re內建物件用法  e.分組用法  f.環視用法

所有關於正規表示式的操作都使用python標準庫的re模組;

python大檔案操作

我們知道python進行資料處理時有相應的庫,此篇只是針對python標準庫中file檔案操作中的read,readline,readlines等進行介紹 我們使用file讀取檔案時常看到直接使用read readlines 等一次性把檔案讀取完畢,這樣對小檔案來說當然可以,但是對於大檔案來說就可能...

ruby 操作大檔案

本人測試的ruby版本是ruby1.9.3p286 首先我讀取乙個 100m 的1.txt檔案 然後將它完全複製到另乙個2.txt中,發現只能複製45736kb 主要部分如下 puts 檔案大小是 位元組 檔案再大它的大小還是能夠正確的讀出來的 while value file.gets file1...

python 讀取大檔案

以前一直沒有關注過python讀取大檔案的問題,因為一直都是順順暢暢地讀取了檔案。直到今天有人問我python怎麼讀取檔案出現了記憶體不足的錯誤?我才發現原來大檔案 gb級別 的讀取和普通檔案的讀取是不一樣的。下面介紹三種我親測可用的方法。這裡的檔案型別可以是txt,dat等型別的檔案。用read ...