phpCURL抓取網頁內容

2022-09-16 10:30:10 字數 1245 閱讀 1928

參考**1:

<?php

//建立乙個新curl資源

$ch =curl_init();

//設定url和相應的選項

curl_setopt($ch, curlopt_url, "");

curl_setopt(

$ch, curlopt_header, false

);//

抓取url並把它傳遞給瀏覽器

$data = curl_exec($ch

);echo

$data;//

關閉curl資源,並且釋放系統資源

curl_close($ch

);?>

$szurl = "";

$useragent = 'mozilla/4.0 (compatible; msie 7.0; windows nt 6.0; slcc1; .net clr 2.0.50727; .net clr 3.0.04506; .net clr 3.5.21022; .net clr 1.0.3705; .net clr 1.1.4322)';

$curl =curl_init();

curl_setopt(

$curl, curlopt_url, $szurl

);curl_setopt(

$curl, curlopt_header, 0); //

0表示不輸出header,1表示輸出

curl_setopt($curl, curlopt_returntransfer, 1);

curl_setopt(

$curl, curlopt_ssl_verifypeer, false

);curl_setopt(

$curl, curlopt_ssl_verifyhost, false

);curl_setopt(

$curl, curlopt_encoding, '');

curl_setopt(

$curl, curlopt_useragent, $useragent

);curl_setopt(

$curl, curlopt_followlocation, 1);

$data = curl_exec($curl

); echo

$data;//

echo curl_errno($curl); //返回0時表示程式執行成功 如何從curl_errno返回值獲取錯誤資訊

exit

();?>

PHP curl 抓取AJAX非同步內容

其實抓ajax非同步內容的頁面和抓普通的頁面區別不大。ajax只不過是做了一次非同步的http請求,只要使用firebug類似的工具,找到請求的後端服務url和傳值的引數,然後對該url傳遞引數進行抓取即可。如果抓去的是頁面,則內容中沒有顯示的資料,是一堆js 加入gzip解析 設定連線結束後儲存c...

網頁內容抓取

之前採用xpath和正規表示式對網頁內容進行抓取,發現在有的地方不如人意,就採用了htmlparser對頁面進行解析,抓取需要的東西。htmlparser有點不好的地方在於不能對starttag和endtag進行匹配。採用了兩種方法進行抓取。第一種,抓取成對的tag之間的內容,採用了queue.qu...

PHP curl 抓取AJAX非同步內容示例

其實抓ajax非同步內容的頁面和抓普通的頁面區別不大。ajax只不過是做了一次非同步的http請求,只要使用firebug類似的工具,找到請求的後端服務url和傳值的引數,然後對該url傳遞引數進行抓取即可。利用firebug的網路工具 如果抓去的是頁面,則內容中沒有顯示的資料,是一堆js curl...