爬蟲相關(2) 解析HTML原始碼

2021-06-20 17:13:25 字數 501 閱讀 9959

但是從我自己的經驗,還是比較傾向於使用jsoup。

這裡先介紹如何使用jsoup完成http connection。

jsoup可以接受本地檔案,http連線,甚至html字串進行解析。比起自己建立連線要方便的多。

示例**:

string html = "";document document = jsoup.parse(html);

document document = jsoup.connect("").get(); //建立連線

string title = document.title();

string text = document.text();

對於document類的操作非常類似於dom4j,簡便快捷。現在還在學習選擇器,剩下的內容晚上繼續補上。

Hdfs 原始碼解析(2)

namenode啟動 namenode持久化了檔案和塊之間的對應關係,也就是在namenode資料目錄下的current fsimage目錄,namenode啟動的時候,會將這個檔案載入到記憶體裡。塊和機器的對應關係,namenode並不持久化,也就是說,namenode在啟動的時候,並不知道檔案塊...

Handler原始碼解析2

handler原始碼解析1 handler原始碼解析2 享元設計模式 記憶體復用,使用同一塊記憶體空間,bitmap,recycleview都有使用這種思想 在loop從訊息佇列中取出訊息並分發完後,並不會把訊息物件銷毀,而是通過msg.recycleunchecked 方法清空訊息放入訊息池進行 ...

Handler原始碼解析2

handler原始碼解析1 handler原始碼解析2 享元設計模式 記憶體復用,使用同一塊記憶體空間,bitmap,recycleview都有使用這種思想 在loop從訊息佇列中取出訊息並分發完後,並不會把訊息物件銷毀,而是通過msg.recycleunchecked 方法清空訊息放入訊息池進行 ...