Beanbun 簡單開放的 PHP 爬蟲框架

2021-09-17 01:32:28 字數 1000 閱讀 9762

我希望有這樣乙個爬蟲框架:在簡單需求的情況下,可以用最少的**快速建立乙個功能完善的爬蟲;而且如果你願意,你可以對爬蟲進行你想要的任何修改。它要天然支援分布式,支援多程序(或執行緒),利用 composer,可以方便的建立起乙個功能強大的爬蟲。

在對之前寫過的乙個爬蟲的功能不斷的刪減調整後,就有了目前的 beanbun,這個名字來自於作者家的貓,此貓名叫門丁,「門丁」是北方的一種麵點。門丁 -> 豆包 -> bean bun。

我希望在這裡能夠拋磚引玉,和大家一起繼續完善 beanbun。

beanbun 可以通過 composer 進行安裝。

$ composer require kiddyu/beanbun
建立乙個檔案 start.php,包含以下內容

<?php

require_once(__dir__ . '/vendor/autoload.php');

use beanbun\beanbun;

$beanbun = new beanbun;

$beanbun->seed = [

'','list-1.html',

'list-2.html',

];$beanbun->afterdownloadpage = function($beanbun) ;

$beanbun->start();

在命令列中執行

$ php start.php
接下來就可以看到抓取的日誌了。

2017-04-04 14:14:14 beanbun worker download  success.

2017-04-04 14:14:14 beanbun worker download list-1.html success.

2017-04-04 14:14:14 beanbun worker download list-2.html success.

php簡單開啟gzip壓縮方法

網頁開啟gzip壓縮以後,其體積可以減小20 90 可以節省下大量的頻寬,從而減少頁面響應時間,提高使用者體驗。php配置改法 zlib.output compression on 開啟gzip功能 zlib.output compression level 4 gzip壓縮級別,1 9,建議3 5...

PHP簡單開啟curl的方法 測試可行

一 問題 windows主機出現 call to undefined function curl init 錯誤提示,沒有定義的函式,也就是php還沒開啟對curl init函式的支援。二 解決方法 需要開啟php的curl函式庫。具體步驟如下 開啟php.ini 通常在c 程式設計客棧 程式設計客...

webapp 的簡單開發

前端 mui view層 control層 後端 php model層 control層 mysql 後端忽略 搭建環境使用hbuilder ide 配套使用mui,裡面可以mui建立模板,支援mui語法提示 ps 也可以使用不同的移動框架,如 sui frozen ui ionic。看看專案目錄結...