java正規表示式注意事項

2021-08-28 23:40:35 字數 789 閱讀 4538

1.(.*?)非貪心匹配,找到合適的就結束,盡可能短的字串,而預設的"貪心的"模式匹配搜尋到的、盡可能長的字串。例如,在字串"oooo"中,"o+?"只匹配單個"o",而"o+"匹配所有"o"。

例如下字串str.只需要匹配到class為tobox的div

string str="\n" +

"\n" +

"修改\n" +

"this is text\n" +

"\n" +

"";使用string reg="[\\s\\s]*?

";即可,但若將「?」去掉,則會匹配到最後乙個div

注意:表示式中的[\\s\\s]匹配任意字元,包含換行,而"."匹配除"\r\n"之外的任何單個字元

2.匹配html中的url,先把所有src標籤取出來,然後再取img中的內容,

string reg="]*>";

pattern p = pattern.compile(reg, pattern.case_insensitive);

matcher m= p.matcher(test);

while (m.find())

system.out.println(group);

}

注意:(1)group的用法:m1.group(0)或者m1.group()表示取整個字串。group(1)表示取第乙個括號中的值。

(2)當匹配的字串中存在換行符時,group會存在多個,也就是說最外層迴圈可能會有多個。當不存在換行符時group只有乙個,而group1會存在多個,也就是第二層迴圈可能會有多個。

正規表示式注意事項

1.所謂組。您檢查一次,你可以選擇多個比賽結果,每個結果是指一組 eg.import re pattern re.compile r match pattern.match hello wa hahatest world if match print match.group 2 print matc...

python正規表示式轉義注意事項

無論哪種語言,在使用正規表示式的時候都避免不了乙個問題,就是在匹配元字元的時候,需要對元字元進行轉義,讓 正規表示式引擎將其當做普通字元來匹配。本文主要以python為例,說明一下轉義中需要注意的問題。python的正規表示式中需要轉義的元字元有以下幾個 python中對元字元的轉義使用雙反斜槓 來...

正規表示式中有關 b 的幾點注意事項

正規表示式中的 b可以用來單詞的邊界。單詞的前邊界,或者是後邊界,或者是同時。基礎用法略去不提,在 b的使用中有這樣幾點是需要格外注意的。像 b mentioned 這樣的表達是無法匹配出 mentioned 這樣的字串的。所以請不要嘗試在提取出的微博的文字中使用 b b 這樣的方式提取被 的使用者...