Java017 正規表示式

2021-09-12 23:49:05 字數 4816 閱讀 4706

其實是用來操作字串的一些規則。其實更多是用正則解決字串操作的問題。
好處

正則的出現,對字串的複雜操作變得更為簡單。
特點

將對字串操作的**用一些符號來表示。只要使用了指定符號,就可以呼叫底層的**對字串進行操作。符號的出現,簡化了**的書寫。
弊端

符號的出現雖然簡化了書寫,但是卻降低了閱讀性。

用小括號標示,每定義乙個小括號,就是乙個組,而且有自動編號,從1開始。

只要使用組,對應的數字就是使用該組的內容。別忘了,陣列要加\\。

(aaa(wwww(ccc))(eee))技巧,從左括號開始數即可。有幾個左括號就是幾組。

匹配
其實用的就是string類中的matches方法。

string reg = "[1-9][0-9]";

boolean b = qq.matches(reg);//將正則和字串關聯對字串進行匹配。

切割
其實用的就是string類中的split方法。
替換
其實用的就是string類中的replaceall();
獲取
先要將正規表示式編譯成正則物件。使用的是pattern中靜態方法 compile(regex);

通過pattern物件獲取matcher物件。

pattern用於描述正規表示式,可以對正規表示式進行解析。

而將規則操作字串,需要從新封裝到匹配器物件matcher中。

然後使用matcher物件的方法來操作字串。

如何獲取匹配器物件呢?

通過pattern物件中的matcher方法。該方法可以正則規則和字串想關聯。並返回匹配器物件。

使用matcher物件中的方法即可對字串進行各種正則操作。

校驗數字的表示式
01 數字:^[0-9]*$ 

02 n位的數字:^\d$

03 至少n位的數字:^\d$

04 m-n位的數字:^\d$

05 零和非零開頭的數字:^(0|[1-9][0-9]*)$

06 非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(.[0-9])?$

07 帶1-2位小數的正數或負數:^(\-)?\d+(\.\d)?$

08 正數、負數、和小數:^(\-|\+)?\d+(\.\d+)?$

09 有兩位小數的正實數:^[0-9]+(.[0-9])?$

10 有1~3位小數的正實數:^[0-9]+(.[0-9])?$

11 非零的正整數:^[1-9]\d*$ 或 ^([1-9][0-9]*)$ 或 ^\+?[1-9][0-9]*$

12 非零的負整數:^\-[1-9]0-9"*$ 或 ^-[1-9]\d*$

13 非負整數:^\d+$ 或 ^[1-9]\d*|0$

14 非正整數:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$

15 非負浮點數:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$

16 非正浮點數:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$

17 正浮點數:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$

18 負浮點數:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$

19 浮點數:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

校驗字元的表示式
01 漢字:^[\u4e00-\u9fa5]$ 

02 英文和數字:^[a-za-z0-9]+$ 或 ^[a-za-z0-9]$

03 長度為3-20的所有字元:^.$

04 由26個英文本母組成的字串:^[a-za-z]+$

05 由26個大寫英文本母組成的字串:^[a-z]+$

06 由26個小寫英文本母組成的字串:^[a-z]+$

07 由數字和26個英文本母組成的字串:^[a-za-z0-9]+$

08 由數字、26個英文本母或者下劃線組成的字串:^\w+$ 或 ^\w$

09 中文、英文、數字包括下劃線:^[\u4e00-\u9fa5a-za-z0-9_]+$

10 中文、英文、數字但不包括下劃線等符號:^[\u4e00-\u9fa5a-za-z0-9]+$ 或 ^[\u4e00-\u9fa5a-za-z0-9]$

11 可以輸入含有^%&',;=?$\"等字元:[^%&',;=?$\x22]+

12 禁止輸入含有~的字元:[^~\x22]+

特殊需求表示式

02 網域名稱:[a-za-z0-9][-a-za-z0-9](/.[a-za-z0-9][-a-za-z0-9])+/.?

03 interneturl:[a-za-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$

04 手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d$

05 **號碼("***-******x"、"***x-******xx"、"***-******x"、"***-******xx"、"******x"和"******xx):^(\(\d-)|\d-)?\d$

06 國內**號碼(0511-4405222、021-87888822):\d-\d|\d-\d

07 身份證號(15位、18位數字):^\d|\d$

08 短身份證號碼(數字、字母x結尾):^([0-9])(x|x)?$ 或 ^\d|[0-9x]|[0-9x]?$

09 帳號是否合法(字母開頭,允許5-16位元組,允許字母數字下劃線):^[a-za-z][a-za-z0-9_]$

10 密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-za-z]\w$

11 強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字元,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[a-z]).$

12 日期格式:^\d-\d-\d

13 一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$

14 乙個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$

15 錢的輸入格式:

16 1.有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$

17 2.這表示任意乙個不以0開頭的數字,但是,這也意味著乙個字元"0"不通過,所以我們採用下面的形式:^(0|[1-9][0-9]*)$

18 3.乙個0或者乙個不以0開頭的數字.我們還可以允許開頭有乙個負號:^(0|-?[1-9][0-9]*)$

19 4.這表示乙個0或者乙個可能為負的開頭不為0的數字.讓使用者以0開頭好了.把負號的也去掉,因為錢總不能是負的吧.下面我們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$

20 5.必須說明的是,小數點後面至少應該有1位數,所以"10."是不通過的,但是 "10" 和 "10.2" 是通過的:^[0-9]+(.[0-9])?$

21 6.這樣我們規定小數點後面必須有兩位,如果你認為太苛刻了,可以這樣:^[0-9]+(.[0-9])?$

22 7.這樣就允許使用者只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:^[0-9](,[0-9])*(.[0-9])?$

23 8.1到3個數字,後面跟著任意個 逗號+3個數字,逗號成為可選,而不是必須:^([0-9]+|[0-9](,[0-9])*)(.[0-9])?$

24 備註:這就是最終結果了,別忘了"+"可以用"*"替代如果你覺得空字串也可以接受的話(奇怪,為什麼?)最後,別忘了在用函式時去掉去掉那個反斜槓,一般的錯誤都在這裡

25 xml檔案:^([a-za-z]+-?)+[a-za-z0-9]+\\.[x|x][m|m][l|l]$

26 中文字元的正規表示式:[\u4e00-\u9fa5]

27 雙位元組字元:[^\x00-\xff] (包括漢字在內,可以用來計算字串的長度(乙個雙位元組字元長度計2,ascii字元計1))

28 空白行的正規表示式:\n\s*\r (可以用來刪除空白行)

29 html標記的正規表示式:<(\s*?)[^>]*>.*?|<.*? /> (網上流傳的版本太糟糕,上面這個也僅僅能部分,對於複雜的巢狀標記依舊無能為力)

30 首尾空白字元的正規表示式:^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等),非常有用的表示式)

使用快捷鍵"ctrl+f"開啟myeclipse的查詢替換功能

勾選regular expressions

這樣就可以把**中的行號全部去掉

去除**行號的正規表示式:^\s*\d+\.

去除注釋** \/\*(\s|.)*?\*\/

Java正規表示式

正規表示式結構簡介 字元 x 字元 x 反斜槓 0n 十進位制數 0 n 7 0nn 十進位制數 0nn 0 n 7 0mnn 十進位制數 0mnn 0 m 3,0 n 7 xhh 十六進製制數 0xhh uhhhh 十六進製制數 0xhhhh t 製表符 u0009 n 換行符 u000a r 回...

Java正規表示式

方便查詢的東西 基本語法 轉義字元 in d d d 數字0 9 多少到多少 d 非數字 0 9 非 w 單詞字元 a za z0 9 a3 w 非單詞字元 w s 空白 如 n t 0 1次 1 n次 0 n次 必須是n次 大於等於n次 n demo 中文 u0391 uffe5 英文 a za ...

Java正規表示式

舉例說明 the 開頭一定要有 the 字串 of despair 結尾一定要有 of despair 的字串 那麼,abc 就是要求以abc開頭和以abc結尾的字串,實際上是只有abc匹配。notice 匹配包含notice的字串。你可以看見如果你沒有用我們提到的兩個字元 最後乙個例子 就是說 模...