php phpquery簡易爬蟲抓取京東商品分類

2021-09-22 06:32:20 字數 1062 閱讀 7330

phpquery教程可在這裡檢視:

2、抓取程式

<?php 

/** created on 2015-1-29

* * to change the template for this generated file go to

* window - preferences - phpeclipse - php - code templates */

header("content-type:text/html; charset=utf-8");

function getpage( $url

)include 'phpquery/phpquery.php';

$url = '';

$page = getpage($url

);//

phpquery::newdocumenthtml($page);

phpquery::newdocumentfile($url

);$firstcate = pq('#allsort .m');

$id = 0;

foreach($firstcate

as$first

)

echo "#0#1

";$companies = pq($first)->find(".mc dl");

$parent_id = $id

;

foreach($companies

as$company

)

} }?>

3、執行效果

這樣可以抓取京東商品分類的資訊了。可以加上資料庫,將資料儲存在資料庫中,這樣可以更利於資料的儲存和操作。雖然這裡只是抓取京東商品的分類,如果延伸一下的話還可以抓取商品**,好評差評等資訊。這裡就不一一細說了,具體問題具體解決,完全看需求。如果有需要的話還可以做成萬能的,輸入標籤的xpath,然後得到具體的值;這純屬yy,有興趣的可以網上找找資料,實現的方式應該也不少。

php phpquery簡易爬蟲抓取京東商品分類

phpquery教程可在這裡檢視 2 抓取程式 created on 2015 1 29 to change the template for this generated file go to window preferences phpeclipse php code templates hea...

php phpquery簡易爬蟲抓取京東商品分類

phpquery教程可在這裡檢視 2 抓取程式 created on 2015 1 29 to change the template for this generated file go to window preferences phpeclipse php code templates hea...

簡易文字爬蟲

正規表示式 1 使用re.findall 所有符合條件的 一般查詢列表結果就是所獲得值 re.search 一條符合記錄的 通過match物件內的group編號或命名,獲得對應的值 title re.research html,re.s group 1 能包括換行符 使用sub 替換 實現換頁功能 ...