C 中使用正規表示式提取超連結位址的集中方法

2022-02-23 18:21:33 字數 1057 閱讀 3977

一般在做爬蟲或者cms的時候經常需要提取 href鏈結或者是src位址。此時可以使用正規表示式輕鬆完成。

regex

reg = new

regex(@"(?is)]*?href=(['""]?)(?[^'""\s>]+)\1[^>]*>(?(?:(?!");            

matchcollection mc = reg.matches(yourstr);            

foreach (match m in mc)           

方法2:

regex r;        

match m;         

r = new regex("href\\s*=\\s*(?:\"(?<1>[^\"]*)\"|(?<1>\\s+))",           

regexoptions.ignorecase|regexoptions.compiled);       

for (m = r.match(inputstring); m.success; m = m.nextmatch())        

方法3:提取img src的

regex reg = new 

regex(@"(?i)]*?\ssrc\s*=\s*(['""]?)(?[^'""\s>]+)\1[^>]*>");  

matchcollection mc = reg.matches(yourstr);  

foreach (match m in mc)   

方法4:

提取img src

///

/// 獲取img的路徑        

///

/// html字串文字

/// 以陣列形式返回路徑

public static string gethtmlimageurllist(string htmltext)      

return surllist;    

}

C 中使用正規表示式提取超連結位址的集中方法

一般在做爬蟲或者cms的時候經常需要提取 href鏈結或者是src位址。此時可以使用正規表示式輕鬆完成。regex reg new regex is href s 1 matchcollection mc reg.matches yourstr foreach match m in mc 方法2 c...

超連結提取的正規表示式

匯入 using system.text.regularexpressions 測試成功 string str regex re new regex href s s s regexoptions.ignorecase regexoptions.singleline matchcollection ...

微軟面試題 正規表示式提取鏈結位址

寫出正規表示式,從乙個字串中提取鏈結位址。比如下面字串中 it面試題部落格中包含很多 微軟面試題 微軟面試題 則需要提取的位址為 微軟面試題 在python中 import re p re.compile href content it面試題部落格中包含很多 p.search content gro...