Python 中re庫的簡單使用

2021-08-31 13:22:57 字數 944 閱讀 9867

1.findall() 方法(返回乙個列表)

**如下:

import re

text = ""

f = open("testtext.txt",'r',encoding="cp936")

for each_line in f:

text = text+each_line

f.close()

#result = re.findall(" ([a-z][a-z][a-z]) ",text) # return list 「」內是需要匹配的內容,這裡a-z指的是所以的英文本母,得到結果加上「()」,返回時,返回的是括號裡的內容。

result = re.findall(" (a[a-z][a-z]) | (a[a-z][a-z]) ",text) #找到文章中所有以a開頭的長度為3個字母的單詞。
setdic1 = set()

for each in result: #並將它們轉換為集合格式

if each[0] not in setdic1:

setdic1.add(each[0])

if each[1] not in setdic1:

setdic1.add(each[1])

result = re.findall("[a-z]+",text) 

setdic = set(result) #return set 可以將返回的列表轉換成集合形式。

count = 0

for iteam in setdic:

count = count+1

print(result)

#print(setdic)

#print(count)

#print(text)

python中re庫基礎

正規表示式 基礎使用方法 data re.compile d re.i re.s 建立正規表示式物件 第二個引數代表忽略大小寫以及換行 str data.findall zfc 進行字串匹配 返回是列表形式 re類 正規表示式 萬能匹配 zfc asdkfgjosadjfo1234asdtfgw e...

python中re模組的使用

res re.match pattern,string,flags 0 字串的開頭是否能匹配正規表示式。返回 sre.sre match物件,如果 不能匹配返回none。如果匹配的話,res.string可以獲得原始的字串,並不是匹配的字串 re.sub pattern,repl,string,co...

re庫的使用

如果直接給出字元,就是精確匹配。用 d可以匹配乙個數字,w可以匹配乙個字母或數字 s1 00 d 可以匹配 007 但是匹配不了 00a s2 d d d 可以匹配 010 s3 w w w 可以匹配 py3 s4 s 空格s1 py.pyc pyo py2 符號功能 任意個字元,包括0個 至少乙個...