記錄一次使用jsoup爬取頁面

2021-10-12 17:35:34 字數 1032 閱讀 5951

第一次了解爬蟲,首先要引入乙個jar包:

org.projectlombok<

/groupid>

lombok<

/artifactid>

true

<

/optional>

<

/dependency>

org.jsoup<

/groupid>

jsoup<

/artifactid>

1.10

.2<

/version>

<

/dependency>

引入到專案中後,編寫以下**:

//實體類 用於轉換爬取到的資訊 我這裡是用了lombok外掛程式的 第乙個依賴

@data

@allargsconstructor

@noargsconstructor

public

class

order

implements

serializable

以下是爬取的方法:

/**

* @description:

* @author: ljp

* @createdate: 2020/12/23 16:18

*/public

class

spidersutil

public list

parsejd

(string keywords)

throws exception

} system.out.

println

(list.

size()

);return list;

}}

其實蠻簡單的,就是通過引入的jar包可以爬取網頁,將爬取到的html頁面解析為xml格式,然後再去解析這個xml拿到你需要的東西就可以了,這裡爬取的是豬八戒的招標列表,記錄一下!

記錄一次oracle使用記錄

使用oracle資料庫的專案到我這邊,需要修改,咱雖然 學過 oracle,但那畢竟已經過去了。哈哈。使用database configuration assistant 建立資料庫,建立快完的時候,說我沒有監聽啥的,然後 通過 net manager 建立了,qizhong1 其中選中的那個就是建...

關於 的一次使用記錄

使用場景 專案裡面在做乙個請求時候發現,不同的請求,有些請求會跳轉到 spring mvc的自定義方法中,有些卻不進去。自定義的方法 class com.zhuanche.car.web.resolver.adminbaseformargumentresolver adminbaseformargu...

記錄一次面試

怎麼觀察系統中 記憶體 行為 a.通過 proc zoneinfo 檔案,可以看到 free high low min pages 關係 free high 時候 一般不開啟 kswapd 執行緒 high free low 時,開啟 kswapd 執行緒 low free min時,alloc p...