用php抓取網頁內容方法總結

2021-06-16 05:40:06 字數 1472 閱讀 7573

用php抓取頁面的內容在實際的開發當中是非常有用的,如作乙個簡單的內容採集器,提取網頁中的部分內容等等,抓取到的內容在通過正規表示式做一下過濾就得到了你想要的內容,至於如何用正規表示式過濾,在這裡就不做介紹了,有興趣的同學可以參考本站的《正規表示式》板塊: ,以下就是幾種常用的用php抓取網頁中的內容的方法。

1.file_get_contents

php**

<?php    

$url = ""; 

$contents = file_get_contents($url); 

//如果出現中文亂碼使用下面** 

//$getcontent = iconv("gb2312", "utf-8",$contents);  

echo $contents; 

?>   

2.curl

php**

<?php    

$url = ""; 

$ch = curl_init(); 

$timeout = 5; 

curl_setopt($ch, curlopt_url, $url); 

curl_setopt($ch, curlopt_returntransfer, 1); 

curl_setopt($ch, curlopt_connecttimeout, $timeout); 

//在需要使用者檢測的網頁裡需要增加下面兩行 

?>  注:

1.使用file_get_contents和fopen必須空間開啟allow_url_fopen。方法:編輯php.ini,設定 allow_url_fopen = on,allow_url_fopen關閉時fopen和file_get_contents都不能開啟遠端檔案。

2.使用curl必須空間開啟curl。方法:windows下修改php.ini,將extension=php_curl.dll前面的分號去掉,而 且需要拷貝ssleay32.dll和libeay32.dll到c:/windows/system32下;linux下要安裝curl擴充套件。

用php抓取網頁內容方法總結

用php抓取頁面的內容在實際的開發當中是非常有用的,如作乙個簡單的內容採集器,提取網頁中的部分內容等等,抓取到的內容在通過正規表示式做一下過濾就得到了你想要的內容,至於如何用正規表示式過濾,在這裡就不做介紹了,有興趣的同學可以參考本站的 正規表示式 板塊 以下就是幾種常用的用php抓取網頁中的內容的...

PHP 網頁內容抓取 抓取網頁內容的兩種常用方法

說到網頁內容的抓取,最常用的兩種方式 1.利用file get contents 函式,簡簡單單 2.curl抓取工具。curl是乙個非常強大的開源庫,支援很多協議,包括http ftp telnet等,我們使用它來傳送http請求。它給我 們帶來的好處是可以通過靈活的選項設定不同的http協議引數...

ZH乳酪 PHP抓取網頁方法總結

from 在做一些天氣預報或者rss訂閱的程式時,往往需要抓取非本地檔案,一般情況下都是利用php模擬瀏覽器的訪問,通過http請求訪問url位址,然後得到html源 或者xml資料。1.file 函式 2.file get contents 函式 4.curl方式 5.fsockopen 函式 s...