python 用正規表示式篩選文字資訊

2022-03-17 00:57:42 字數 1937 閱讀 8780

【摘要】  本文主要介紹如何對多個文字進行讀取,並採用正規表示式對其中的資訊進行篩選,將篩選出來的資訊存寫到乙個新文字。

開啟檔案:open(『檔名』,『開啟方式』)>>>file=open(r'c:\users\yuanlei\desktop\mytxt.txt','w+').為避免報錯,在檔名的引號前加個r.

檔案開啟方式:唯讀——r或rt,rb為二進位制檔案;開啟檔案前清空檔案內容——w或wt;在文末寫入——a+;

清空內容然後在文末寫入——w+;寫到檔案任意位置——r+;

關閉檔案:檔案開啟執行好後必須要關閉——檔名.close()>>>mytxt.close()

讀取檔案中的內容:將每行內容,包括換行符,作為乙個元素存入陣列——lines=file_object.readlines(),但是這樣會把換行符也賦進去

去除換行符——new_lines=lines.splitlines()

1

#coding: utf-8 2#

讀取文字中的中英文資料並使用正規表示式將所需資料篩選入到乙個新文字中

3import

re

4import

os 56

#zhengze函式對讀取到的資料進行篩選,並將篩選好的資料存入陣列new_lines

7 new_lines= #

申明new_lines陣列

8def

zhengze(f):

9 regex_str="

.*?(l.*?e).*"10

for x in

f:

11 new_x = x.splitlines() #

注意:splitlines是將傳入的字串去除'\n'之後以陣列的形式傳出,而不是字串形式

12 match_obj=re.match(regex_str,new_x[0])

13if

match_obj:

15else

: no

')

17return

new_lines

1819

#獲取指定資料夾下的所有文字的絕對位址,並存入陣列file_path

20 path=r'

c:\users\yuanlei\desktop\new_file_txt

'21 file_path=

22for filename in os.listdir(path): #

獲取path下所有檔案的路徑

2324

print

file_path

2526

#對每個文字呼叫正則函式進行篩選,篩選過後的資料存入陣列final

27for adress in

file_path:

28 file_object=open(adress)

29 lines = file_object.readlines( ) #

將文字中的內容以陣列的形式(每行為乙個元素)賦給lines

30file_object.close()

31 final=zhengze(lines)

32print

final

3334

#將篩選出來的資料寫入新文字re_new.txt

35 file_2=open(r'

c:\users\yuanlei\desktop\re_new.txt

','w+

')

36for x in

final:

37file_2.write(x)

38 file_2.write('\n'

) 39 file_2.close()

iOS 正規表示式用作篩選

需求 實現乙個只能輸入英文和數字的輸入框,並且必須是英文開頭 純英文,英文 數字,但不能是 xml 實現 void textfielddidendediting uitextfield textfield cell metadatacell cell nslog basicmetadata basi...

python正規表示式元字元 正規表示式

字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...

Python 正規表示式

1.在python中,所有和正規表示式相關的功能都包含在re模組中。2.字元 表示 字串的末尾 如 road 則表示 只有當 road 出現在乙個字串的尾部時才會匹配。3.字元 表示 字元中的開始 如 road 則表示 只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...