Python基礎之正規表示式

2021-10-24 05:27:01 字數 2157 閱讀 2352

本節將介紹python中正規表示式最基本的用法,正規表示式本身不做太多介紹。

python中正規表示式的內建模組是re,最基本的用法是判斷某個字串是否符合某個表示式,分組,找出乙個字串中所有符合某個表示式的列表。

可通過search()函式和match()函式來實現,不同之處是match函式是從字串的起始字元開始判斷,而search函式是從任意位置開始判斷。例如:

search:

import re

# check if a string matches a regexp

str = "www.google.com"

match = re.search('g.*e', str)

print(match)

print(match.span())

print(str[match.start():match.end()])

print()

match = re.search('ag.*e', str)

if match:

print("match")

else:

print("not match")

print()

# search and group

match = re.search('(g.*e)\.(com)', str)

if match:

print(match.group(1))

print(match.group(2))

else:

print("not match.")

執行結果:

d:\work\python_workspace\python_study\venv\scripts\python.exe d:/work/python_workspace/python_study/basic_11/search.py

(4, 10)

google

not match

google

comprocess finished with exit code 0

match:

import re

str = "www.google.com"

match = re.match("www", str)

print(match)

match = re.match("google", str)

print(match)

執行結果:

d:\work\python_workspace\python_study\venv\scripts\python.exe d:/work/python_workspace/python_study/basic_11/match.py

none

process finished with exit code 0

這也是乙個非常有用的操作,在網路爬蟲方面應用廣泛。例如:

import re

str = "www.google.com, www.qq.com, "

result = re.findall('www\..*?\.com', str)

for r in result:

print(r)

執行結果:

process finished with exit code 0當然,re模組中還有其它的函式,如splitsub等,由於不太常用,這裡就不過多介紹。

Python基礎之正規表示式

1.正則模組匯入 python中內建正規表示式模組,使用正規表示式時應提前匯入該模組 import re 2.正則命令 匹配任意字元 n除外 匹配字串的起始部分 匹配字串的結束部分 連續匹配0次或多次 連續匹配1次或多次 連續匹配0次或1次 或。匹配 左右表示式任意乙個,從左到右匹配,如果 沒有包括...

Python 正規表示式(基礎)

正規表示式 regular expression 是乙個特殊的字串行,描述了一種字串匹配的模式可以用來檢查乙個串是否含有某種子串 將匹配的子串替換或者從某個串中取出符合某個條件的子串,或者是在指定的文章中,抓取特定的字串等。python處理正規表示式的模組是re模組,它是python語言擁有全部的正...

Python正規表示式基礎

直接給出字元就是精確匹配。特殊字元首先需要轉義如 d 匹配乙個數字,w 匹配乙個字母或者數字。123 d 可以匹配 1231 但是無法匹配 123a d d d 可以匹配到 123 w w w 可以匹配到 py3 表示任意乙個字元,py.可以表示py3 py 等 表示任意長個字元,表示至少乙個字元,...