Jsoup文件 解析body片段

2021-08-28 13:30:18 字數 665 閱讀 1714

使用jsoup.parsebodyfragment(html)方法。

string html = "lorem ipsum.

";document doc = jsoup.parsebodyfragment(html);

element body = doc.body();

parsebodyfragment方法建立乙個空文件,並插入解析過的html到body元素中。使用普通的jsoup.parse(string html)方法通常也可以得到相同的結果,但是顯式的將輸入看作乙個body片段可以確保使用者輸入的任何糟糕的html解析成body元素。

document.body()方法能夠檢索文件物件中body元素的所有子元素,它相當於doc.getelementsbytag("body")

如果需要接受來自使用者輸入的html,需要小心的避免跨站點指令碼(cross-site)攻擊。利用基於whitelist的清除器和clean(string bodyhtml, whitelist whitelist)方法來清除使用者輸入的惡意內容。

關於jsoup解析http文件

1.第一次用jsoup,是用來解析乙個關於新聞的網頁,但是這個網頁比較簡單,所以對於jsoup的了解不是很清楚。2.在寫android程式時,有時需要解析html頁面,特別是那類通過爬 抓取資料的應用,比如 天氣預報等應用。如果是桌面應用可以使用htmlparser這個強大的工具,但是在androi...

Jsoup庫 解析DOM文件

dom文件包括 html,xml等等 jsoup 獲取資料的方式 html 文字,url,本地html string html html text document doc jsoup.parse html doc.title string url get 方式獲取資料 try catch ioex...

網頁解析之Jsoup

jsoup功能非常強大,可以解析乙個完整的網頁,當然了,也可以解析乙個網頁的一部分,還可以解析乙個字串,文字。具體使用可以參考使用文件,這裡我主要講解如何解析乙個完整的網頁。1.獲取網頁的資料 httpclient client new defaulthttpclient 例項化乙個httpclie...