python的re模組使用 獲取URL中可用的部分

2021-08-17 11:57:22 字數 846 閱讀 8126

url字串:

目標:獲取www.google.com.hk/search

import re

url = ""

pattern = re.compile(r'http[s]?://(.*?)\?')

1.使用re.match

re.match 嘗試從字串的起始位置匹配乙個模式,如果不是起始位置匹配成功的話,match()就返回none。

path = pattern.match(url)

if path:

print path.group(1)

else:

print path

2.使用re.findall

在字串中找到正規表示式所匹配的所有子串,並返回乙個列表,如果沒有找到匹配的,則返回空列表。

path = pattern.findall(url)

print path

# ['www.google.com.hk/search']

3.使用re.search

re.search 掃瞄整個字串並返回第乙個成功的匹配。

path = pattern.search(url)

if path:

print path.group(1)

else:

print path

總結:1.re.match只匹配字串的

開始,如果字串開始不符合正規表示式,則匹配失敗,函式返回none;而re.search

匹配整個字串

,直到找到乙個匹配。

python中re模組的使用

res re.match pattern,string,flags 0 字串的開頭是否能匹配正規表示式。返回 sre.sre match物件,如果 不能匹配返回none。如果匹配的話,res.string可以獲得原始的字串,並不是匹配的字串 re.sub pattern,repl,string,co...

python模組 re的詳細使用

print re.findall hello world re.findall r 3 3 ds 結 3 re.findall ab cabc3abcbbac 結果 ab ab a re.findall ab?abcabcabcadf 結果 ab ab ab a re.findall cb bchb...

python模組 re模組

匹配任意字元 匹配指定字元類別 字元開頭 字元結尾 取非字元 重複多次字元 0次或多次 重複多次字元 1次或多次 重複單次字元 左右表示式任意匹配 重複m到n次字元 重複m次字元 d 匹配任何十進位制數,相當於 0 9 d 匹配任何非數字字元,相當於 0 9 s 匹配任何空白字元,相當於 fdss ...