Python讀寫檔案

2021-08-10 11:41:27 字數 4050 閱讀 9694

python讀寫檔案

1.open

使用open開啟檔案後一定要記得呼叫檔案物件的close()方法。比如可以用try/finally語句來確保最後能關閉檔案。

file_object = open('thefile.txt')

try:

all_the_text = file_object.read( )

finally:

file_object.close( )

注:不能把open語句放在try塊裡,因為當開啟檔案出現異常時,檔案物件file_object無法執行close()方法。

2.讀檔案

讀文字檔案

input = open('data', 'r')

#第二個引數預設為r

input = open('data')

讀二進位制檔案

input = open('data', 'rb')

讀取所有內容

file_object = open('thefile.txt')

try:

all_the_text = file_object.read( )

finally:

file_object.close( )

讀固定位元組

file_object = open('abinfile', 'rb')

try:

while true:

chunk = file_object.read(100)

if not chunk:

break

do_something_with(chunk)

finally:

file_object.close( )

讀每行list_of_all_the_lines = file_object.readlines( )

如果檔案是文字檔案,還可以直接遍歷檔案物件獲取每行:

for line in file_object:

process line

3.寫檔案

寫文字檔案

output = open('data', 'w')

寫二進位制檔案

output = open('data', 'wb')

追加寫檔案

output = open('data', 'w+')

寫資料file_object = open('thefile.txt', 'w')

file_object.write(all_the_text)

file_object.close( )

寫入多行

file_object.writelines(list_of_text_strings)

注意,呼叫writelines寫入多行在效能上會比使用write一次性寫入要高。

在處理日誌檔案的時候,常常會遇到這樣的情況:日誌檔案巨大,不可能一次性把整個檔案讀入到記憶體中進行處理,例如需要在一台物理記憶體為 2gb 的機器上處理乙個 2gb 的日誌檔案,我們可能希望每次只處理其中 200mb 的內容。

在 python 中,內建的 file 物件直接提供了乙個 readlines(sizehint) 函式來完成這樣的事情。以下面的**為例:

file = open('test.log', 'r')sizehint = 209715200   # 200mposition = 0lines = file.readlines(sizehint)while not file.tell() - position < 0:       position = file.tell()       lines = file.readlines(sizehint)

每次呼叫 readlines(sizehint) 函式,會返回大約 200mb 的資料,而且所返回的必然都是完整的行資料,大多數情況下,返回的資料的位元組數會稍微比 sizehint 指定的值大一點(除最後一次呼叫 readlines(sizehint) 函式的時候)。通常情況下,python 會自動將使用者指定的 sizehint 的值調整成內部快取大小的整數倍。

file在python是乙個特殊的型別,它用於在python程式中對外部的檔案進行操作。在python中一切都是物件,file也不例外,file有file的方法和屬性。下面先來看如何建立乙個file物件:

file(name[, mode[, buffering]]) 

file()函式用於建立乙個file物件,它有乙個別名叫open(),可能更形象一些,它們是內建函式。來看看它的引數。它引數都是以字串的形式傳遞的。name是檔案的名字。

mode是開啟的模式,可選的值為r w a u,分別代表讀(預設) 寫 新增支援各種換行符的模式。用w或a模式開啟檔案的話,如果檔案不存在,那麼就自動建立。此外,用w模式開啟乙個已經存在的檔案時,原有檔案的內容會被清空,因為一開始檔案的操作的標記是在檔案的開頭的,這時候進行寫操作,無疑會把原有的內容給抹掉。由於歷史的原因,換行符在不同的系統中有不同模式,比如在 unix中是乙個\n,而在windows中是『\r\n』,用u模式開啟檔案,就是支援所有的換行模式,也就說『\r』 '\n' '\r\n'都可表示換行,會有乙個tuple用來存貯這個檔案中用到過的換行符。不過,雖說換行有多種模式,讀到python中統一用\n代替。在模式字元的後面,還可以加上+ b t這兩種標識,分別表示可以對檔案同時進行讀寫操作和用二進位制模式、文字模式(預設)開啟檔案。

buffering如果為0表示不進行緩衝;如果為1表示進行「行緩衝「;如果是乙個大於1的數表示緩衝區的大小,應該是以位元組為單位的。

file物件有自己的屬性和方法。先來看看file的屬性。

closed #標記檔案是否已經關閉,由close()改寫 

encoding #檔案編碼 

mode #開啟模式 

name #檔名 

newlines #檔案中用到的換行模式,是乙個tuple 

softspace #boolean型,一般為0,據說用於print

file的讀寫方法:

f.read([size]) #size為讀取的長度,以byte為單位 

f.readline([size]) 

#讀一行,如果定義了size,有可能返回的只是一行的一部分 

f.readlines([size]) 

#把檔案每一行作為乙個list的乙個成員,並返回這個list。其實它的內部是通過迴圈呼叫readline()來實現的。如果提供size引數,size是表示讀取內容的總長,也就是說可能唯讀到檔案的一部分。 

f.write(str) 

#把str寫到檔案中,write()並不會在str後加上乙個換行符 

f.writelines(seq) 

#把seq的內容全部寫到檔案中。這個函式也只是忠實地寫入,不會在每行後面加上任何東西。 

file的其他方法:

f.close() 

#關閉檔案。python會在乙個檔案不用後自動關閉檔案,不過這一功能沒***,最好還是養成自己關閉的習慣。如果乙個檔案在關閉後還對其進行操作會產生valueerror 

f.flush() 

#把緩衝區的內容寫入硬碟 

f.fileno() 

#返回乙個長整型的」檔案標籤「 

f.isatty() 

#檔案是否是乙個終端裝置檔案(unix系統中的) 

f.tell() 

#返回檔案操作標記的當前位置,以檔案的開頭為原點 

f.next() 

#返回下一行,並將檔案操作標記位移到下一行。把乙個file用於for ... in file這樣的語句時,就是呼叫next()函式來實現遍歷的。 

f.seek(offset[,whence]) 

#將檔案打操作標記移到offset的位置。這個offset一般是相對於檔案的開頭來計算的,一般為正數。但如果提供了whence引數就不一定了,whence可以為0表示從頭開始計算,1表示以當前位置為原點計算。2表示以檔案末尾為原點進行計算。需要注意,如果檔案以a或a+的模式開啟,每次進行寫操作時,檔案操作標記會自動返回到檔案末尾。 

f.truncate([size]) 

#把檔案裁成規定的大小,預設的是裁到當前檔案操作標記的位置。如果size比檔案的大小還要大,依據系統的不同可能是不改變檔案,也可能是用0把檔案補到相應的大小,也可能是以一些隨機的內容加上去。

Python檔案讀寫

今天在看python檔案讀寫操作,發現python file name mode buffering file 函式用於建立乙個file物件,它有乙個別名叫open 可能更形象一些,它們是內建函式。來看看它的引數。它引數都是以字串的形式傳遞的。name是檔案的名字。mode 是開啟的模式,可選的值為...

python檔案讀寫

檔案讀寫模式 模式 描述 r以讀方式開啟檔案,可讀取檔案資訊。w以寫方式開啟檔案,可向檔案寫入資訊。如檔案存在,則清空該檔案,再寫入新內容 a以追加模式開啟檔案 即一開啟檔案,檔案指標自動移到檔案末尾 如果檔案不存在則建立 r 以讀寫方式開啟檔案,可對檔案進行讀和寫操作。w 消除檔案內容,然後以讀寫...

python 讀寫檔案

python讀寫檔案在文字不大的情況可以用正常的 open 然後讀入 readline行讀入 或者整體讀入 read readlines 基本知識 file open path,r 說明 第乙個引數是檔名稱,包括路徑 第二個引數是開啟的模式mode r 唯讀 預設。如果檔案不存在,則丟擲錯誤 w 只...