正規表示式概述

2021-09-19 22:51:15 字數 3192 閱讀 5482

正規表示式概述

正規表示式,⼜稱正規表示式、正規表示法、正規表示式、規則表示式、常 規表示法(英語:regular expression,在**中常簡寫為regex、regexp或 re),是電腦科學的⼀個概念。正規表示式使⽤單個字串來描述、匹配 ⼀系列匹配某個句法規則的字串。在很多⽂本編輯器⾥,正規表示式通常 被⽤來檢索、替換那些匹配某個模式的⽂本。

regular expression的「regular」⼀般被譯為「正則」、「正規」、「常規」。此處 的「regular」即是「規則」、「規律」的意思,regular expression即「描述某種規則 的表示式」之意。

re模組操作

在python中需要通過正規表示式對字串進⾏匹配的時候,可以使⽤⼀個模 塊,名字為re

re模組的使⽤過程

#coding=utf-8

# 導⼊re模組

import re

# 使⽤match⽅法進⾏匹配操作

result = re.match(正規表示式,要匹配的字串)

# 如果上⼀步匹配到資料的話,可以使⽤group⽅法來提取資料

result.group()

123

4567

re.match是⽤來進⾏正則匹配檢查的⽅法,若字串匹配正則 表示式,則match⽅法返回匹配物件(match object),否則 返回none(注意不是空字串"")。

匹配物件macth object具有group⽅法,⽤來返回字串的匹 配部分。

2. re模組示例(匹配以itcast開頭的語句)

#coding=utf-8

import re

result = re.match(「itcast」,「itcast.cn」)

re模組操作

result.group()

運⾏結果為:

itcast

3. 說明

re.match() 能夠匹配出以***開頭的字串

表示字元

字元 功能

. 匹配任意1個字元(除了\n)

[ ] 匹配[ ]中列舉的字元

\d 匹配數字,即0-9

\d 匹配⾮數字,即不是數字

\s 匹配空⽩,即 空格,tab鍵

\s 匹配⾮空⽩

\w 匹配單詞字元,即a-z、a-z、0-9、_

\w 匹配⾮單詞字元

表示數量

匹配多個字元的相關格式

字元 功能

? 匹配前⼀個字元出現1次或者0次,即要麼有1次,要麼沒有

匹配前⼀個字元出現m次

匹配前⼀個字元⾄少出現m次

匹配前⼀個字元出現從m到n次

表示邊界

字元 功能

^ 匹配字串開頭

$ 匹配字串結尾

\b 匹配⼀個單詞的邊界

\b 匹配⾮單詞邊界

匹配分組

字元 功能

| 匹配左右任意⼀個表示式

(ab) 將括號中字元作為⼀個分組

\num 引⽤分組num匹配到的字串

(?p) 分組起別名

(?p=name) 引⽤別名為name分組匹配到的字串

python貪婪和⾮貪婪

python⾥數量詞預設是貪婪的(在少數語⾔⾥也可能是預設⾮貪婪),總是 嘗試匹配盡可能多的字元;

⾮貪婪則相反,總是嘗試匹配盡可能少的字元。

在"*","?","+",""後⾯加上?,使貪婪變成⾮貪婪。

re模組操作

在python中需要通過正規表示式對字串進⾏匹配的時候,可以使⽤⼀個模 塊,名字為re

re模組的使⽤過程

#coding=utf-8

# 導⼊re模組

import re

# 使⽤match⽅法進⾏匹配操作

result = re.match(正規表示式,要匹配的字串)

# 如果上⼀步匹配到資料的話,可以使⽤group⽅法來提取資料

result.group()

123

4567

re.match是⽤來進⾏正則匹配檢查的⽅法,若字串匹配正則 表示式,則match⽅法返回匹配物件(match object),否則 返回none(注意不是空字串"")。

匹配物件macth object具有group⽅法,⽤來返回字串的匹 配部分。

2. re模組示例(匹配以itcast開頭的語句)

#coding=utf-8

import re

result = re.match(「itcast」,「itcast.cn」)

re模組操作

result.group()

運⾏結果為:

itcast

3. 說明

re.match() 能夠匹配出以***開頭的字串

表示字元

字元 功能

. 匹配任意1個字元(除了\n)

[ ] 匹配[ ]中列舉的字元

\d 匹配數字,即0-9

\d 匹配⾮數字,即不是數字

\s 匹配空⽩,即 空格,tab鍵

\s 匹配⾮空⽩

\w 匹配單詞字元,即a-z、a-z、0-9、_

\w 匹配⾮單詞字元

表示數量

匹配多個字元的相關格式

字元 功能

? 匹配前⼀個字元出現1次或者0次,即要麼有1次,要麼沒有

匹配前⼀個字元出現m次

匹配前⼀個字元⾄少出現m次

匹配前⼀個字元出現從m到n次

表示邊界

字元 功能

^ 匹配字串開頭

$ 匹配字串結尾

\b 匹配⼀個單詞的邊界

\b 匹配⾮單詞邊界

匹配分組

字元 功能

| 匹配左右任意⼀個表示式

(ab) 將括號中字元作為⼀個分組

\num 引⽤分組num匹配到的字串

(?p) 分組起別名

(?p=name) 引⽤別名為name分組匹配到的字串

python貪婪和⾮貪婪

python⾥數量詞預設是貪婪的(在少數語⾔⾥也可能是預設⾮貪婪),總是 嘗試匹配盡可能多的字元;

⾮貪婪則相反,總是嘗試匹配盡可能少的字元。

在"*","?","+",""後⾯加上?,使貪婪變成⾮貪婪。

正規表示式概述

正規表示式,稱正規表示式 正規表示法 正規表示式 規則表示式 常 規表示法 英語 regular expression,在 中常簡寫為regex regexp或 re 是電腦科學的 個概念。正規表示式使 單個字串來描述 匹配 系列匹配某個句法規則的字串。在很多 本編輯器 正規表示式通常 被 來檢索 ...

概述正規表示式

昨天在牛客網刷試題的時候有一道關於較複雜的正規表示式,一臉懵逼,所以想著今天總結整理一下。然後在github上看了看,這篇不錯 github上關於正規表示式的介紹 1 正規表示式是什麼 正規表示式是一組由字母和符號組成的特殊文字,它可以用來從文字中找出滿足你想要的格式的句子.2 基本匹配 正規表示式...

正規表示式概述 什麼是正規表示式

正規表示式概述 正規表示式在程式語言中存在著廣泛的應用,特別是用來處理字串。如匹配字串 查詢字串 替換字串等。可以說,正規表示式是一段文字或乙個公式,它是用來描述用某種模式去匹配一類字串的公式,並且該公式具有一定的模式。本小節將介紹正規表示式的基本概念 第乙個正規表示式,以及測試正規表示式的工具co...