正規表示式

2021-09-02 14:05:16 字數 3029 閱讀 8381

構造正規表示式的方法和建立數學表示式的方法一樣。也就是用多種元字元與運算子可以將小的表示式結合在一起來建立更大的表示式。正規表示式的元件可以是單個的字元、字元集合、字元範圍、字元間的選擇或者所有這些元件的任意組合。

正規表示式是由普通字元(例如字元 a 到 z)以及特殊字元(稱為"元字元")組成的文字模式。模式描述在搜尋文字時要匹配的乙個或多個字串。正規表示式作為乙個模板,將某個字元模式與所搜尋的字串進行匹配。

字元描述

/將下乙個字元標記為特殊字元,例如,'\n'匹配換行符

()標記子表示式的開始和結束

^匹配字串的開始位置,例如,『^t』以t開始的字串

$匹配字串的結束位置,例如,'t$'以t結束的字串

*匹配子表示式零次或多次

+匹配子表示式一次或多次

?匹配子表示式零次或一次

n是乙個非負整數,匹配確定的n次

n是乙個非負整數,匹配至少n次

n和m均為非負整數,且n<=m,匹配最少n次且最多m次

|匹配x或y

[xyz]

匹配所包含的任意乙個字元

[^xyz]

匹配未包含的任意字元

[a-z]

匹配指定範圍內的任意字元

[^a-z]

匹配任何不在指定範圍內的任意字元

\d匹配乙個數字字元

\d匹配乙個非數字字元

\s匹配任何空白字元

\b匹配乙個單詞的邊界,即字與空格間的位置

網域名稱:[a-za-z0-9][-a-za-z0-9](/.[a-za-z0-9][-a-za-z0-9])+/.?interneturl:[a-za-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d$**號碼("***-******x"、"***x-******xx"、"***-******x"、"***-******xx"、"******x"和"******xx):^(\(\d-)|\d-)?\d$國內**號碼(0511-4405222、021-87888822):\d-\d|\d-\d**號碼正規表示式(支援手機號碼,3-4位區號,7-8位直播號碼,1-4位分機號):((\d)|^((\d)|(\d|\d)-(\d)|(\d|\d)-(\d)-(\d|\d|\d|\d)|(\d)-(\d|\d|\d|\d))$)身份證號(15位、18位數字),最後一位是校驗位,可能為數字或字元x:(^\d$)|(^\d$)|(^\d(\d|x|x)$)帳號是否合法(字母開頭,允許5-16位元組,允許字母數字下劃線):^[a-za-z][a-za-z0-9_]$密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-za-z]\w$強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字元,長度在 8-10 之間):^(?=.*\d)(?=.*[a-z])(?=.*[a-z])[a-za-z0-9]$強密碼(必須包含大小寫字母和數字的組合,可以使用特殊字元,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[a-z]).$日期格式:^\d-\d-\d一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$乙個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$錢的輸入格式:

有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$這表示任意乙個不以0開頭的數字,但是,這也意味著乙個字元"0"不通過,所以我們採用下面的形式:^(0|[1-9][0-9]*)$乙個0或者乙個不以0開頭的數字.我們還可以允許開頭有乙個負號:^(0|-?[1-9][0-9]*)$這表示乙個0或者乙個可能為負的開頭不為0的數字.讓使用者以0開頭好了.把負號的也去掉,因為錢總不能是負的吧。下面我們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$必須說明的是,小數點後面至少應該有1位數,所以"10."是不通過的,但是 "10" 和 "10.2" 是通過的:^[0-9]+(.[0-9])?$這樣我們規定小數點後面必須有兩位,如果你認為太苛刻了,可以這樣:^[0-9]+(.[0-9])?$這樣就允許使用者只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:^[0-9](,[0-9])*(.[0-9])?$1到3個數字,後面跟著任意個 逗號+3個數字,逗號成為可選,而不是必須:^([0-9]+|[0-9](,[0-9])*)(.[0-9])?$備註:這就是最終結果了,別忘了"+"可以用"*"替代如果你覺得空字串也可以接受的話(奇怪,為什麼?)最後,別忘了在用函式時去掉去掉那個反斜槓,一般的錯誤都在這裡

xml檔案:^([a-za-z]+-?)+[a-za-z0-9]+\\.[x|x][m|m][l|l]$中文字元的正規表示式:[\u4e00-\u9fa5]雙位元組字元:[^\x00-\xff] (包括漢字在內,可以用來計算字串的長度(乙個雙位元組字元長度計2,ascii字元計1))空白行的正規表示式:\n\s*\r (可以用來刪除空白行)html標記的正規表示式:<(\s*?)[^>]*>.*?|<.*? /> ( 首尾空白字元的正規表示式:^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等),非常有用的表示式)

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...