正則抓取百度搜尋結果

2021-06-19 22:40:37 字數 2230 閱讀 6950

<?php

$key="電腦";

$url=''.$key;

$result=file_get_contents($url);

$pattern='#class="resitem".*?(.*?)#si';

preg_match_all($pattern,$result,$matches);

echo'';

print_r($matches[1]);

print_r($matches[2]);

$key="電腦";

$url=''.$key;

$result=file_get_contents($url);

$pattern='#class="result.*?class="t".*?(.*?)#si';

preg_match_all($pattern,$result,$matches);

echo'';

print_r($matches[1]);

print_r($matches[2]);

//說明:(分析pc版)

//正則匹配首先要分析html結構,鎖定迴圈部分,

//然後取得最簡錨點,class="result(這裡沒有後面的",因為存在class="result-op"這種)

//接下來再對迴圈內部進行取錨點,class="result......

//而在整個result中可能存在多種(.*?)這樣的格式,

//因此找到依賴class="t",得到class="result...class="t"......

//過濾掉其他部分,留下我們想要的內容。

//正則中間的.*?就是用來遮蔽無關內容(...部分),這部分內容對於我們的結果不會造成影響

//而我們需要的鏈結(href="【...】")和標題(【...】)則可以使用子模式,

//從而可以在匹配結果中順序取出,子模式是加括號。

//最後替換...成.*?,需要獲取資料的加上括號(),則得到正規表示式:

//'#class="result.*?class="t".*?(.*?)#si'

//注:? > 注釋時連在一起寫會語法錯誤,使用時請將[問號]換回來

//end_php

模仿百度搜尋

中國春節網 歡迎光臨中國春節網,您現在的位置是中國春節網首頁!年獸 的傳說 熬 年的傳說 萬年建立歷年說 中國 倒貼福字 除夕夜歡迎光臨中國春節網,您現在的位置是中國春節網首頁!年獸 的傳說 熬年的傳說 萬年建立歷年說 中國 倒貼福字 除夕夜.中國春節網 歡迎光臨中國春節網,您現在的位置是中國春節網...

百度搜尋技巧

例子 電影 qvod 查詢詞 電影 在搜尋結果中,qvod 被必需被包含在搜尋結果中。6 site搜尋範圍限定在特定站點中 您如果知道某個站點中有自己需要找的東西,就可以把搜尋範圍限定在這個站點中,提高查詢效率。site 後面跟的站點網域名稱,不要帶 http site 和站點名之間,不要帶空格。7...

百度搜尋技巧

舉例 pan.baidu.com 侏羅紀 把搜尋範圍限定在某乙個 中 site k8s site csdn.net 精準匹配 雙引號和書名號 中國山西大學 如果查詢詞比較長,我們一般加引號,表示不要拆分。手機 如果不加書名號,會出現手機,加了會出現電影 減號語法 在搜尋結果中有些不想要的 linux...