Jsoup工具類簡介

2021-09-26 04:36:50 字數 2031 閱讀 1498

jsoup工具類簡介

1.jsoup:用於解析xml或是html文件 ->獲取document

2.docuemnt: public class document extends element 包含整個xml內容

3.element:獲取子element物件,屬性,文字內容

4.elements:包含若干element的arraylist

5.node

6.selector:選擇器

參考:

1.jsoup:用於解析xml或是html文件 ->獲取document

靜態parse返回document物件:  parse the contents of a file as html 

1.parse​(file in, string charsetname)

//解析本地檔案

2.parse​(url url,int timeoutmillis)

//only http & https protocols supported

2.docuemnt: public class document extends element 包含整個xml內容

獲取element/elements物件(來自父類element)

1.element getelementbyid​(string id)

2.elements getelementsbytag​(string tagname)

3.elements getelementsbyattribute​(string key)

4.elements getelementsbyattributevalue​(string key, string value)

5.elements getelementsbyattributevaluecontaining(string key,string with)

6.selector:選擇器->快捷查詢

(同上也**父類element)

6.elements select​(string query)

1.document.select("person[number=s1]");

//person標籤中的屬性number值為s1

2.document.select("person[number=s1]>name");

//person標籤中的屬性number值為s1的name子標籤

3.document.select("person name[id = first]");

//person的name子標籤中的屬性id且值為first的

3.element:獲取子element物件,屬性,文字內容

獲取element物件:

1.element getelementbyid​(string id)

2.elements getelementsbytag​(string tagname)

3.elements getelementsbyattribute​(string key)

4.elements getelementsbyattributevalue​(string key, string value)

5.elements getelementsbyattributevaluecontaining(string key,string with)

獲取屬性值(來自node)

1.string attr​(string attributekey)

獲取文字內容:

1.string text​() //所有文字資訊

2.string html​() //按含標籤的文字資訊

4.elements :public class elements extends arraylist

5.node:層次關係(父類->子類)

node -> element -> document

併發工具類簡介

countdownlatch 閉鎖,也叫執行緒遞減鎖。對執行緒進行計數,在計數歸零之前執行緒會陷入阻塞 直到計數歸零為止,才會放開阻塞。用給定的計數初始化 countdownlatch。由於呼叫了 countdown 方法,所以在當前計數到達零之前,await 方法會一直受阻塞。之後,會釋放所有等待...

java 中的併發工具類簡介

1 等待多執行緒完成的countdownlatch countdownlatch允許乙個或多個執行緒等待其他執行緒完成操作。2 同步屏障cyclicbarrier cyclicbarrier的字面意思是可迴圈使用 cyclic 的屏障 barrier 它要做的事情是,讓一組執行緒到達乙個屏障 也可以...

jsoup爬蟲工具超簡單使用 記錄

簡單入門案例 document document null trycatch ioexception e if document null return 接下來獲取到了document物件,就等於獲取了頁面的所有資訊對document的操作 通過class獲取乙個元素節點 elements list...