用php抓取網頁內容方法總結

2022-03-16 08:57:24 字數 1429 閱讀 8446

用php抓取頁面的內容在實際的開發當中是非常有用的,如作乙個簡單的內容採集器,提取網頁中的部分內容等等,抓取到的內容在通過正規表示式做一下過濾就得到了你想要的內容,至於如何用正規表示式過濾,在這裡就不做介紹了,有興趣的同學可以參考本站的《正規表示式》板塊:以下就是幾種常用的用php抓取網頁中的內容的方法。

1.file_get_contents

php**

<?php

$url="";

$contents=file_get_contents($url);

//如果出現中文亂碼使用下面**

//$getcontent=iconv("gb2312","utf-8",$contents);

echo$contents;

?>

2.curl

php**

<?php

$url="";

$ch=curl_init();

$timeout=5;

curl_setopt($ch,curlopt_url,$url);

curl_setopt($ch,curlopt_returntransfer,1);

curl_setopt($ch,curlopt_connecttimeout,$timeout);

//在需要使用者檢測的網頁裡需要增加下面兩行

注:1.使用file_get_contents和fopen必須空間開啟allow_url_fopen。方法:編輯php.ini,設定allow_url_fopen = on,allow_url_fopen關閉時fopen和file_get_contents都不能開啟遠端檔案。

2.使用curl必須空間開啟curl。方法:windows下修改php.ini,將extension=php_curl.dll前面的分號去掉,而且需要拷貝ssleay32.dll和libeay32.dll到c:\windows\system32下;linux下要安裝curl擴充套件。

用php抓取網頁內容方法總結

用php抓取頁面的內容在實際的開發當中是非常有用的,如作乙個簡單的內容採集器,提取網頁中的部分內容等等,抓取到的內容在通過正規表示式做一下過濾就得到了你想要的內容,至於如何用正規表示式過濾,在這裡就不做介紹了,有興趣的同學可以參考本站的 正規表示式 板塊 以下就是幾種常用的用php抓取網頁中的內容的...

PHP 網頁內容抓取 抓取網頁內容的兩種常用方法

說到網頁內容的抓取,最常用的兩種方式 1.利用file get contents 函式,簡簡單單 2.curl抓取工具。curl是乙個非常強大的開源庫,支援很多協議,包括http ftp telnet等,我們使用它來傳送http請求。它給我 們帶來的好處是可以通過靈活的選項設定不同的http協議引數...

ZH乳酪 PHP抓取網頁方法總結

from 在做一些天氣預報或者rss訂閱的程式時,往往需要抓取非本地檔案,一般情況下都是利用php模擬瀏覽器的訪問,通過http請求訪問url位址,然後得到html源 或者xml資料。1.file 函式 2.file get contents 函式 4.curl方式 5.fsockopen 函式 s...