正規表示式基本規則

2021-08-18 21:31:34 字數 858 閱讀 8965

把上面的規則連線起來,就獲得了完整的正規表示式。

[a-za

-z0-9\

._+]

+@[a-za-z]

+\.(com|org|edu|net)

2:正規表示式常用符號

3:簡單示例

a:注意**中的正規表示式

# coding=utf-8

"""@author: jiajiknag

待抓取的網頁是

"""from urllib.request import urlopen

from bs4 import beautifulsoup

import re

# urlopen 用來開啟並讀取乙個從網路獲取的遠端物件

html = urlopen("")

bs0j = beautifulsoup(html)

images = bs0j.findall("img",)

for image in images:

print(image["src"])

b:結果

不全面,如有關於正規表示式的會繼續更新,博主只是用來作為自己的電子筆記以後方便查閱罷了!!!

基本正規表示式規則

一 特殊字元 eg bhi b.blucy b 這個意思是以hi開頭的以lucy結尾的不換行的字元 1.b 這個叫元字元,代表單詞的開頭或結尾,即單詞的分界處,只是乙個位置 2.這個叫元字元,匹配 除 換行符外的任意字元 3.1 也是元字元,不代表任何字元,而是指代數量,意味著其前面的內容可以重複數...

正規表示式基本規則

正則 解釋 r 回車 n 換行 t 製表符 d 任意乙個數字,0 9 中的任意乙個 w任意乙個字母或數字或下劃線,也就是 a z,a z,0 9,中任意乙個 s包括空格 製表符 換頁符等空白字元的其中任意乙個 小數點可以匹配除了換行符 n 以外的任意乙個字元 a.d 匹配 aaa100 得到 aa1...

正規表示式基本規則

a 字元 x 字元 x。舉例 a 表示字元a 反斜線字元。n 新行 換行 符 u000a r 回車符 u000d b 字元類 abc a b 或 c 簡單類 abc 任何字元,除了 a b 或 c 否定 a za z a到 z 或 a到 z,兩頭的字母包括在內 範圍 0 9 0到9的字元都包括 c ...