得到頁面中的所有鏈結函式

2022-02-01 13:03:30 字數 995 閱讀 8631

這個函式是以前做搜尋引擎的時候遇見過的, 

x1代表的是當前文件的http位址,而x2代表的是頁面中的鏈結位址

" 這樣的沒有再判斷,一般也用不著。"

如果要得到頁面中的所有鏈結,可以使用下面的** 

code

string

strregex =@"

((href|href|src|src)[ ]*=[ ]*[""'][^""'#>]+[""'])|((href|href|src|src)[ ]*=[ ]*[\s]+)";

//@"(href|href|src|src)[ ]*=[ ]*[""'][^""'#>]+[""']";

regex r 

=new

regex(strregex, regexoptions.ignorecase);

matchcollection m 

=r.matches(htmlpage);

可以得到href.src的所有鏈結,包括帶雙引號,單引號,沒有引號的鏈結,使用mtracer.exe測試通過

Python獲取當前頁面內的所有鏈結的五種方法

本文講述了 python 獲取當前頁面內的所有鏈結的五種方法,分享給大家僅供參考,具體如下 利用 requests html from requests html import htmlsession session htmlsession url r session.get url print r...

如何清除WORD EXCEL中的所有超連結

如何清除word excel中的所有超連結 超級鏈結文字不變 刪除word中所有超連結的方法如下 開啟word的選單 工具 巨集 visual basic 編輯器,或直接按快捷鍵 alt f11,開啟visual basic 編輯器,在visual basic 編輯器中選擇選單 插入 模組,之後會出...

檢視linux中硬鏈結的所有檔案

在linux中,鏈結檔案分為硬鏈結和軟鏈結檔案兩種,其中硬鏈結通過ln source file dist file建立,軟鏈結通過ln s source file dist file建立。需要檢視硬鏈結的所有檔案的位置 第一步 ls il 檢視檔案的inode 第二步 find inum inode...