使用jsoup.parsebodyfragment(html)
方法。
string html = "lorem ipsum.
";document doc = jsoup.parsebodyfragment(html);
element body = doc.body();
parsebodyfragment
方法建立乙個空文件,並插入解析過的html到body
元素中。使用普通的jsoup.parse(string html)
方法通常也可以得到相同的結果,但是顯式的將輸入看作乙個body片段可以確保使用者輸入的任何糟糕的html解析成body
元素。
document.body()
方法能夠檢索文件物件中body
元素的所有子元素,它相當於doc.getelementsbytag("body")
。
如果需要接受來自使用者輸入的html,需要小心的避免跨站點指令碼(cross-site)攻擊。利用基於whitelist
的清除器和clean(string bodyhtml, whitelist whitelist)
方法來清除使用者輸入的惡意內容。
關於jsoup解析http文件
1.第一次用jsoup,是用來解析乙個關於新聞的網頁,但是這個網頁比較簡單,所以對於jsoup的了解不是很清楚。2.在寫android程式時,有時需要解析html頁面,特別是那類通過爬 抓取資料的應用,比如 天氣預報等應用。如果是桌面應用可以使用htmlparser這個強大的工具,但是在androi...
Jsoup庫 解析DOM文件
dom文件包括 html,xml等等 jsoup 獲取資料的方式 html 文字,url,本地html string html html text document doc jsoup.parse html doc.title string url get 方式獲取資料 try catch ioex...
網頁解析之Jsoup
jsoup功能非常強大,可以解析乙個完整的網頁,當然了,也可以解析乙個網頁的一部分,還可以解析乙個字串,文字。具體使用可以參考使用文件,這裡我主要講解如何解析乙個完整的網頁。1.獲取網頁的資料 httpclient client new defaulthttpclient 例項化乙個httpclie...