正則的matche方法和search方法

2021-08-10 20:12:25 字數 3800 閱讀 8100

1.matche方法match(string[, pos[, endpos]])

string:匹配使用的文字,

pos: 文字中正規表示式開始搜尋的索引。及開始搜尋

string

的下標

endpos: 文字中正規表示式結束搜尋的索引。

如果不指定pos,預設是從開頭開始匹配,如果匹配不到,直接返回

none

import re

reg = re.compile(r'\w*(hello w.*)(hello v.*)')

#print(dir(reg))

a = 'aahello world hello vfx'

result = reg.match(a)

print(result)

print(result.groups())

如果不加 \w* 返回是 none。

如果不指定

pos的話,預設是從字串開始位置匹配,匹配不到就返回

none

2.search的方法

search(string[, pos[, endpos]])

這個方法用於查詢字串中可以匹配成功的子串。從string的

pos下標處起嘗試匹配

reg,如果

reg結束時仍可匹配,則返回乙個

match

物件;若無法匹配,則將

pos加

1後重新嘗試匹配;直到

pos=endpos

時仍無法匹配則返回

none

import re

reg = re.compile(r'\w*(hello w.*)(hello v.*)')

#print(dir(reg))

a = 'aahello world hello vfx'

result = reg.match(a)

print(result)

print(result.groups())

b = 'aa' +a

result2 = reg.match(b)

print(result2)

result3 = reg.search(b)

print(result3)

print(result3.groups())

推薦使用matche,比較精準,快速。search要全部都搜,很慢。

3.re的split的使用方法

split(string[, maxsplit])

按照能夠匹配的子串將string分割後返回列表。

maxsplit

用於指定最大分割次數,不指定將全部分割。

import re

p = re.compile(r'\d+')

print(p.split('one1two2three3four4'))

返回結果為:

['one', 'two', 'three', 'four', '']

4.正則物件的

findall

方法

findall(string[, pos[, endpos]])

搜尋string,以列表形式返回全部能匹配的子串.

import re

p = re.compile(r'\d+')

print(findall('one1two2three3four4'))

結果:

['1', '2', '3', '4']

結果:findall是把匹配到的字串最後一列表的形式返回回去

5.正則物件的

finditer

方法

finditer(string[, pos[, endpos]])

搜尋string,返回乙個順序訪問每乙個匹配結果(

match

物件)的迭代器。

import re

p = re.compile(r'\d+')

print(type(p.finditer('one1two2three3four4')))

for m in p.finditer('one1two2three3four4'):

print(type(m))

print(m.group())

結果為:

4

解釋:p.finditer('one1two2three3four4')是乙個迭代器,而返回的每個m都是

match

物件,group

方法也會在下一節進行詳細介紹。

6. match匹配物件

match物件是一次匹配的結果,包含了很多關於此次匹配的資訊,可以使用

match

提供的可讀屬性或方法來獲取這些資訊。

上面的過程中多次使用了match物件,呼叫了他的

group()

和groups()

等方法。

import re

prog = re.compile(r'(?pabc)(.*)(?p=tagname)')

result1 = prog.match('abclfjlad234sjldabc')

print(result1)

print(result1.groups())

print result1.group('tagname')

print(result1.group(2))

print(result1.groupdict())

返回結果:

<_sre.sre_match object at 0x00000000033400b8>

('abc', 'lfjlad234sjld')

abclfjlad234sjld

說明:1, 我們可以看到result1已經由字串轉換成了乙個正則物件。

2, resule.groups()可以檢視出來所有匹配到的資料,每個

()是乙個元素,最終返回乙個

tuple

3, group()既可以通過下標(從

1開始)的方式訪問,也可以通過分組名進行訪問。

4, groupdict只能顯示有分組名的資料

group([group1, …]): 

獲得乙個或多個分組截獲的字串;指定多個引數時將以元組形式返回。group1可以使用編號也可以使用別名;編號

0代表整個匹配的子串;不填寫引數時,返回

group(0)

;沒有截獲字串的組返回

none

;截獲了多次的組返回最後一次截獲的子串。

groups([default]): 

以元組形式返回全部分組截獲的字串。相當於呼叫group(1,2,…last)。

default

表示沒有截獲字串的組以這個值替代,預設為

none。

groupdict([default]): 

返回以有別名的組的別名為鍵、以該組截獲的子串為值的字典,沒有別名的組不包含在內。default含義同上。

正則的方法

1.閉包 函式在呼叫的時候會形成乙個私有的作用域,對內部變數起到保護的作用,這就是閉包。2.變數銷毀 1.人為銷毀 var a 12 a null 2.自然銷毀 函式呼叫完成之後 瀏覽器會自動銷毀函式內的變數 3閉包作用 保護變數 快取資料 4.閉包的種類 1.函式式 2.物件式 5.函式返回值的問...

Python 正則物件的方法

re 模組使python 語言擁有全部的正規表示式功能 complile函式根據乙個模式字串和可選的標誌函式生成乙個正規表示式物件。該物件擁有一系列方法用於正規表示式匹配和替換。1.match 方法 rematch 嘗試從字串的起始位置匹配乙個模式,如果不是起始位置匹配成的話,match 返回non...

正則常用的方法總結

正則物件常用的方法 一 test方法 檢測某個字串是否匹配,有的話返回true,沒有的話返回false。接受乙個字串作為引數。二exec方法 接受的是字串,返回的結果是陣列。這個陣列是乙個物件,該方法中的正則物件如果不是全域性匹配,即沒有g修飾符,則每次呼叫只會從字串開頭處匹配第乙個結果,且每次呼叫...