Python安全操作檔案讀寫的方式

2021-08-28 04:09:18 字數 3413 閱讀 5297

讀寫檔案是最常見的io操作。python內建了讀寫檔案的函式,用法和c是相容的。

讀寫檔案前,我們先必須了解一下,在磁碟上讀寫檔案的功能都是由作業系統提供的,現代作業系統不允許普通的程式直接操作磁碟,所以,讀寫檔案就是請求作業系統開啟乙個檔案物件(通常稱為檔案描述符),然後,通過作業系統提供的介面從這個檔案物件中讀取資料(讀檔案),或者把資料寫入這個檔案物件(寫檔案)。

要以讀檔案的模式開啟乙個檔案物件,使用python內建的open()函式,傳入檔名和標示符:

>>> f = open('/users/michael/test.txt', 'r')
標示符'r'表示讀,這樣,我們就成功地開啟了乙個檔案。

如果檔案不存在,open()函式就會丟擲乙個ioerror的錯誤,並且給出錯誤碼和詳細的資訊告訴你檔案不存在:

>>> f=open('/users/michael/notfound.txt', 'r')

traceback (most recent call last):

file "", line 1, in filenotfounderror: [errno 2] no such file or directory: '/users/michael/notfound.txt'

如果檔案開啟成功,接下來,呼叫read()方法可以一次讀取檔案的全部內容,python把內容讀到記憶體,用乙個str物件表示:

>>> f.read()

'hello, world!'

最後一步是呼叫close()方法關閉檔案。檔案使用完畢後必須關閉,因為檔案物件會占用作業系統的資源,並且作業系統同一時間能開啟的檔案數量也是有限的:

>>> f.close()
由於檔案讀寫時都有可能產生ioerror,一旦出錯,後面的f.close()就不會呼叫。所以,為了保證無論是否出錯都能正確地關閉檔案,我們可以使用try ... finally來實現:

try:

f = open('/path/to/file', 'r')

print(f.read())

finally:

if f:

f.close()

但是每次都這麼寫實在太繁瑣,所以,python引入了with語句來自動幫我們呼叫close()方法:

with open('/path/to/file', 'r') as f:

print(f.read())

這和前面的try ... finally是一樣的,但是**更佳簡潔,並且不必呼叫f.close()方法。

呼叫read()會一次性讀取檔案的全部內容,如果檔案有10g,記憶體就爆了,所以,要保險起見,可以反覆呼叫read(size)方法,每次最多讀取size個位元組的內容。另外,呼叫readline()可以每次讀取一行內容,呼叫readlines()一次讀取所有內容並按行返回list。因此,要根據需要決定怎麼呼叫。

如果檔案很小,read()一次性讀取最方便;如果不能確定檔案大小,反覆呼叫read(size)比較保險;如果是配置檔案,呼叫readlines()最方便:

for line in f.readlines():

print(line.strip()) # 把末尾的'\n'刪掉

open()函式返回的這種有個read()方法的物件,在python中統稱為file-like object。除了file外,還可以是記憶體的位元組流,網路流,自定義流等等。file-like object不要求從特定類繼承,只要寫個read()方法就行。

stringio就是在記憶體中建立的file-like object,常用作臨時緩衝。

b'\xff\xd8\xff\xe1\x00\x18exif\x00\x00...' # 十六進製制表示的位元組

>>> f = open('/users/michael/gbk.txt', 'r', encoding='gbk')

>>> f.read()

'測試'

遇到有些編碼不規範的檔案,你可能會遇到unicodedecodeerror,因為在文字檔案中可能夾雜了一些非法編碼的字元。遇到這種情況,open()函式還接收乙個errors引數,表示如果遇到編碼錯誤後如何處理。最簡單的方式是直接忽略:

>>> f = open('/users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')
寫檔案和讀檔案是一樣的,唯一區別是呼叫open()函式時,傳入識別符號'w'或者'wb'表示寫文字檔案或寫二進位制檔案:

>>> f = open('/users/michael/test.txt', 'w')

>>> f.write('hello, world!')

>>> f.close()

你可以反覆呼叫write()來寫入檔案,但是務必要呼叫f.close()來關閉檔案。當我們寫檔案時,作業系統往往不會立刻把資料寫入磁碟,而是放到記憶體快取起來,空閒的時候再慢慢寫入。只有呼叫close()方法時,作業系統才保證把沒有寫入的資料全部寫入磁碟。忘記呼叫close()的後果是資料可能只寫了一部分到磁碟,剩下的丟失了。所以,還是用with語句來得保險:

with open('/users/michael/test.txt', 'w') as f:

f.write('hello, world!')

要寫入特定編碼的文字檔案,請給open()函式傳入encoding引數,將字串自動轉換成指定編碼。

所有模式的定義及含義可以參考python的官方文件。

Python操作檔案讀寫

import csv from pdfminer.converter import pdfpageaggregator from pdfminer.layout import laparams from pdfminer.pdfparser import pdfparser,pdfdocument ...

Python操作檔案的讀寫

使用 with open 方法,使用此方法不需要關閉檔案,with open 結束自動關閉 with open 路徑 讀寫方式 編碼方式 錯誤處理方式 as 檔案物件 讀寫檔案的 塊 例如 with open path,r encoding utf 8 errors ignore as file o...

python 操作檔案 檔案讀寫

python進行檔案讀寫的函式是open或file file handler open filename,mode table mode 模式 描述 r以讀方式開啟檔案,可讀取檔案資訊。w以寫方式開啟檔案,可向檔案寫入資訊。如檔案存在,則清空該檔案,再寫入新內容 a以追加模式開啟檔案 即一開啟檔案,...