fileinput模組 逐行讀取多個檔案

2022-07-08 19:06:11 字數 1852 閱讀 5982

前面章節中,我們學會了使用 open() 和 read()(或者 readline()、readlines() )組合,來讀取單個檔案中的資料。但在某些場景中,可能需要讀取多個檔案的資料,這種情況下,再使用這個組合,顯然就不合適了。

慶幸的是,python 提供了 fileinput 模組,通過該模組中的 input()  函式,我們能同時開啟指定的多個檔案,還可以逐個讀取這些檔案中的內容。

fileinput 模組中 input() 該函式的語法格式如下:

fileinput.input(files="filename1, filename2, ...", inplace=false, backup='', bufsize=0, mode='r', openhook=none)

此函式會返回乙個 fileinput 物件,它可以理解為是將多個指定檔案合併之後的檔案物件。其中,各個引數的含義如下:

注意,和 open() 函式不同,input() 函式不能指定開啟檔案的編碼格式,這意味著使用該函式讀取的所有檔案,除非以二進位制方式進行讀取,否則該檔案編碼格式都必須和當前作業系統預設的編碼格式相同,不然 python 直譯器可能會提示 unicodedecodeerror 錯誤。

和 open() 函式返回單個的檔案物件不同,fileinput 物件無需呼叫類似 read()、readline()、readlines() 這樣的函式,直接通過 for 迴圈即可按次序讀取多個檔案中的資料。

值得一提的是,fileinput 模組還提供了很多使用的函式(如表 1 所示),通過呼叫這些函式,可以幫我們更快地實現想要的功能。

表 1 fileinput 模組常用函式

函式名功能描述

fileinput.filename()

返回當前正在讀取的檔名稱。

fileinput.fileno()

返回當前正在讀取檔案的檔案描述符。

fileinput.lineno()

返回當前讀取了多少行。

fileinput.filelineno()

返回當前正在讀取的內容位於當前檔案中的行號。

fileinput.isfirstline()

判斷當前讀取的內容在當前檔案中是否位於第 1 行。

fileinput.nextfile()

關閉當前正在讀取的檔案,並開始讀取下乙個檔案。

fileinput.close()

關閉 fileinput 物件。

檔案描述符是乙個檔案的代號,其值為乙個整數。後續章節將會介紹關於檔案描述符的操作。

講了這麼多,接下來舉個例子。假設使用 input() 讀取 2 個檔案,分別為 my_file.txt 和 file.txt,它們位於同一目錄,且各自包含的內容如下所示:

#file.txt

python教程

#my_file.txt

linux教程

下面程式演示了如何使用 input() 函式依次讀取這 2 個檔案:

import fileinput

#使用for迴圈遍歷 fileinput 物件

for line in fileinput.input(files=('my_file.txt', 'file.txt')):

# 輸出讀取到的內容

print(line)

# 關閉檔案流

fileinput.close()

在使用 fileinput 模組中的 input() 函式之前,一定要先引入 fileinput 模組。

程式執行結果為:

linux教程

python教程

顯然,讀取檔案內容的次序,取決於 input() 函式中檔名的先後次序。

Python模組學習 Fileinput

fileinput是python提供的標準庫,使用fileinput模組可以依次讀取命令列引數中給出的多個檔案。也就是說,它可以遍歷 sys.ar 1 並按行讀取列表中的檔案。如果該列表為空,則fileinput預設讀取標準輸入中的內容。fileinput的使用方法非常簡單,大部分情況下,我們直接呼...

C語言逐行讀取檔案

c語言可以說是我學習的第一門語言,不過似乎也是忘的最多的一門語言,自從因為專案需要重新拾起c語言,我的噩夢就開始了。依稀記得大二學習資料結構時程式設計解決 約瑟夫環 迷宮 等問題後的驕傲,認為c簡直就是天神一般的語言,如此強大,如此讓人著迷。後來學了c 後來開始搞.net,後來自學了css和簡要的p...

linux shell 逐行讀取檔案行

while ifs n for line in ls l do count done echo count注意 for讀取時,自動按空格作為間隔符。因此需要將ifs定義為按換行符分隔 ls l forout.log maxlength wc l forout.log for i in seq max...