Jsoup文件解析body片段

2021-08-28 13:30:18 字數 665 閱讀 1714

使用jsoup.parsebodyfragment(html)方法。

string html = "lorem ipsum.
";document doc = jsoup.parsebodyfragment(html);
element body = doc.body();

parsebodyfragment方法建立乙個空文件，並插入解析過的html到body元素中。使用普通的jsoup.parse(string html)方法通常也可以得到相同的結果，但是顯式的將輸入看作乙個body片段可以確保使用者輸入的任何糟糕的html解析成body元素。

document.body()方法能夠檢索文件物件中body元素的所有子元素，它相當於doc.getelementsbytag("body")。

如果需要接受來自使用者輸入的html，需要小心的避免跨站點指令碼(cross-site)攻擊。利用基於whitelist的清除器和clean(string bodyhtml, whitelist whitelist)方法來清除使用者輸入的惡意內容。

關於jsoup解析http文件

1.第一次用jsoup，是用來解析乙個關於新聞的網頁，但是這個網頁比較簡單，所以對於jsoup的了解不是很清楚。2.在寫android程式時，有時需要解析html頁面，特別是那類通過爬抓取資料的應用，比如天氣預報等應用。如果是桌面應用可以使用htmlparser這個強大的工具，但是在androi...

Jsoup庫解析DOM文件

dom文件包括 html,xml等等 jsoup 獲取資料的方式 html 文字，url，本地html string html html text document doc jsoup.parse html doc.title string url get 方式獲取資料 try catch ioex...

網頁解析之Jsoup

jsoup功能非常強大，可以解析乙個完整的網頁，當然了，也可以解析乙個網頁的一部分，還可以解析乙個字串，文字。具體使用可以參考使用文件，這裡我主要講解如何解析乙個完整的網頁。1.獲取網頁的資料 httpclient client new defaulthttpclient 例項化乙個httpclie...