正規表示式

2021-04-12 17:39:21 字數 989 閱讀 2072

我們要解析乙個html文件時可利用正規表示式取得標籤內容

例子:以從字串中取出所有a標籤的 id號和內容為例:

aaaaaaaaaa

正規表示式:

[^<]*id[^<]*=[^<]*"(?[^<]*)"[^<]*target[^<]*=[^<]*"[^<]*_blank[^<]*" [^<]*>(?[^<]*)

正則分解:

[^<]* 是乙個很有用的組合,能定位到下乙個查詢關鍵字

(?[^<]*) 

用於取得乙個或者多個值直到遇到下乙個關鍵字

類似乙個正則的變數,給用()號取得的內容進行標識,以便於程式的呼叫

c#呼叫的例子:

string strregex=@"[^<]*id[^<]*=[^<]*"(?[^<]*)"[^<]*target[^<]*=[^<]*"[^<]*_blank[^<]*" [^<]*>(?[^<]*)

";string strsource="aaaaaaaaaa"

system.text.regularexpressions.regex r;

system.text.regularexpressions.matchcollection m;

mc= new system.text.regularexpressions.regex(strregex, system.text.regularexpressions.regexoptions.ignorecase);

ro = mc.matches(strsource);

if (ro.count >= 0)

{for (int i = 0; i < m.count; i++)

{//取出id和內容

string id = ro[i].groups["id"].value;

string topic = ro[i].groups["content"].value;

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...