正規表示式 使用總結

2022-02-19 22:15:01 字數 763 閱讀 2870

1、匹配a標籤  :

2、正則匹配頁面所有a標籤或img標籤

public

static arraylist cutstr(string sstr, string

patrn)

} }

catch

(system.exception ex)

return

al;

}

matchcollection物件取group的方法很好用。推薦!!

匹配頁面所有a標籤正則:  (.+)

這個只能匹配不換行的a。一換行就完蛋。換這個試試:]+?href=\"([^\"]+)\"[^>]*>([^

繼續新增改進版本:可以匹配href後面跟 單引號,雙引號或者不跟符號的情況:

]+?href=["']?([^"']+)["']?[^>]*>([^

匹配頁面所有img標籤正則:  

在另一篇博文中看到乙個關於正則匹配img標籤的例子,貼過來看一下:

(?! - 負向預查後面的字元

.*?貪婪匹配logo前面所有資料

(?!.*?logo) - 意為匹配所有不包含logo

.*/>

則是 匹配所有換行前的》 - 此處不使用 .*? 進行貪婪主要是為了避免 alt="abc>" 這樣中間出現》 字元的情況

不過上面會出現個特例情況

例如alt提示包含logo

自定義屬性

正規表示式基礎教程:

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式使用總結

匹配年月日 0 9 1 9 0 9 1 9 0 9 0 9 1 9 0 9 1 9 0 9 0 13578 1 02 0 1 9 12 0 9 3 01 0 469 11 0 1 9 12 0 9 30 02 0 1 9 1 0 9 2 0 8 匹配中文 u4e00 u9fa5 匹配雙位元組字元,包...

正規表示式使用總結

b 並不匹配這些單詞分隔字元中的任何乙個,它只匹配乙個位置 匹配除了換行符以外的任意字元 前面的內容可以連續重複使用任意次 即0次或多次 前面的內容可以出現0次或1次 匹配任意數量的不包含換行的字元 前面的內容可以連續重複使用1次或多次 即1次或多次 匹配重複任意次,但盡可能少重複的字元 匹配重複1...