初識正規表示式

2022-07-29 16:48:14 字數 1094 閱讀 7755

正規表示式:

1. 概念: 一種字串匹配規則

1.1 判斷 input進來的 是不是qq號 是不是手機號 身份證號 ......

1.2 有乙個檔案,要求把手機號 qq號 取出來

2. 能做什麼:

2.1 可以制定乙個規則:

# 來確認某乙個字串是否符合規則的內容

# 從打斷的字串中找到符合規則的內容

2.2 程式領域

# 1,登入程式頁的都表單驗證 web開發 要求簡單語法

# 2,爬蟲 提取網頁資訊,找到自己需要的資訊,資料分析

# 3,自動化開發 日誌分析

3. 語法:

3.1 元字元

\     轉義符

. 匹配除換行符外任意字元

\w 匹配數字字母下劃線

\d 匹配數字

\s 匹配空白符 \n \t

\n 匹配乙個換行符

\t 匹配乙個製表符

\b 匹配乙個單詞的結尾

^ 匹配字串的開始

$ 匹配字串的開始

\d 匹配非數字

\w 匹配非數字字母下劃線

\s 匹配非空白

a|b 匹配字元a或者字元b

() 匹配括號內的表示式,也表示乙個組 group()

[...] 匹配字元組中的字元

[^..] 匹配除了字元組中字元的所有字元 表示 非

[\d\d] [\w\w] [\s\s] 匹配所有

3.2 量詞 ? + * 貪婪匹配

?     重複0次或者1次

+ 重複1次或者更多次

* 重複0或者更多次

重複n次

重複至少n次或更多次

重複n到m次

在量詞後加? 取消貪婪匹配,變成惰性匹配

?? +? *? 回溯演算法

最常用: .*?x 匹配任意字元,直到找到乙個x

正規表示式 1 初識正規表示式

簡單地說,正規表示式就是一套處理字串的規則和方法,以行為單位對字串進行處理,通過特殊的符號的輔助,我們可以快速的過濾,替換某些特定的字串。運維工作中,會有大量訪問日誌,錯誤日誌,大資料。如何能夠快速的過濾出我們需要的內容,這就需要正規表示式。awk,sed,grep egrep 三劍客要想能工作的更...

正規表示式初識

用來指定乙個字元集合 字元直接是 或 的關係,不是乙個特定的字串,跟 abc 不同 abc a z 在字符集中,元字元 不起作用 abc abc 元字元 在字串尾不起作用 abc 就是普通字元。元字元在字符集首表示匹配補集,abc 就是匹配除了a,b,c以外的字元。匹配行首,位於字串首。制定規則re...

正規表示式初識

正規表示式 為轉義如 表示.郵箱匹配 grep e 0 9a za z 0 9a za z a za z a.txt 查詢郵箱 a z 所有小寫字母 a z 所有大寫字母 0 9 所有數字 0 9 所有非數字 表達取反 0 9 a z 0個或多個小寫字母 a z 至少出現一次小寫字母 a z 出現0...