htmlparser的關鍵類

2021-06-16 05:13:44 字數 760 閱讀 8576

andfilter 相當於乙個and操作符,接受所有同時滿足兩個filter的節點.

cssselectornodefilter 接受所有支援css2選擇器的節點.

hasattributefilter 接受所有否含有某個屬性(還可以設定該屬性的值)的節點.

haschildfilter 接受所有含有子節點符合該filter的節點.

hasparentfilter 接受所有含有父節點符合該filter的節點.

hassiblingfilter 接受所有含有兄弟節點符合該filter的節點.

isequalfilter 接受所有和某個特定的節點相同的節點.

linkregexfilter 接受所有linktag標籤的link值.匹配給定的正規表示式的節點.

linkstringfilter 接受所有linktag標籤的link值,匹配給定的字串的節點.

nodeclassfilter 接受所有接受指定的類的節點.

notfilter 接受所有不符合filter的節點.

orfilter 相當於乙個and操作符,接受所有滿足兩個filter中任意乙個的節點.

regexfilter 接受所有滿足指定正規表示式的string nodes.

stringfilter 接受所有滿足指定string的string nodes.

tagnamefilter 接受所有滿足指定tag名的tagnodes.

xorfilter 相當於乙個xor操作符,接受所有只滿足其中1個filter的節點.

HtmlParser類的說明

htmlparser類 這是乙個處理網頁原始檔的類。這裡涉及到了比較底層的東西。由於現在無法除錯,而且無礙大局,暫時就不深究它了。沒事的時候可以看看 the htmlparse class is used to parse an html page.it is just a utility clas...

htmlParser 工具類使用筆記

鏈結過濾器 parser linkparser new parser 屬性過濾器 hasattributefilter tagfilter new hasattributefilter class info hasattributefilter downloadlinkfilter new hasa...

HTML Parser中包含的方法

node getparent 取得父節點 nodelist getchildren 取得子節點的列表 node getfirstchild 取得第乙個子節點 node getlastchild 取得最後乙個子節點 node getprevioussibling 取得前乙個兄弟 node getnex...