爬蟲 Re庫的match物件

2021-09-01 18:24:56 字數 1053 閱讀 4471

屬性

說明.string

待匹配的文字

.re匹配時使用的pattern物件(正規表示式)

.pos

正規表示式搜尋文字的開始位置(第幾個位置,一般為0)

.endpos

正規表示式搜尋文字的結束位置(最後乙個位置,即所處的第幾個字元)

>>> import re

>>> ls=re.search(r'[1-9]\d','12345678')

>>> if ls:

print(ls.group(0))

123456

>>> ls.pos

0 //開始位置為第0個字元開始,這裡的1為0

>>> ls.endpos

8 //數字8後面乙個位置就是結束位置,因為從0開始數,8後面乙個位置的角標為8

>>> ls.re

re.compile('[1-9]\\d')

>>> ls.string

'12345678'

方法

說明.group(0)

獲得匹配後的字串

.start()

匹配字串在原始字串的開始位置

.end()

匹配字串在原始字串的結束位置

.span()

返回(.start(),.end())

>>> import re

>>> m=re.search(r'[1-9]\d','bit100081 tus100084')

>>> m.string

'bit100081 tus100084'

>>> m.re

re.compile('[1-9]\\d')

>>> m.pos

0>>> m.endpos

19>>> m.group(0)

'100081'

>>> m.start()

3>>> m.end()

9>>> m.span()

(3, 9)

re模組中match物件的方法和屬性

屬性和方法 說 明 pos搜尋的開始位置 endpos 搜尋的結束位置 string 搜尋的字串 re當前使用的正規表示式的物件 lastindex 最後匹配的組索引 lastgroup 最後匹配的組名 group index 0 某個分組的匹配結果。如果index等於0,便是匹配整個正規表示式 g...

爬蟲 之 re庫

a表示正則的規則,b表示字串 從開頭開始匹配,若開頭就匹配失敗,則返回為none result re.match a b result.group 若a 的規則中有用 小括號 圈起來東西,可以按順序由 result.group 1 result.group 2 等匹配得到 掃瞄整個字串,返回第乙個成...

re模組中match物件中的方法和屬性

match物件的方法和屬性 屬性和方法 描述pos 搜尋的開始位置 endpos 搜尋的結束位置 string 搜尋的字串 re當前使用的正規表示式物件 lastindex 最後匹配的組索引 lastgroup 最後匹配的組名 group index 某個組匹配的結果 groups 所有分組的匹配結...