php中常見的爬蟲框架有Beanbun、PHPCrawl和phpspider
1.Beanbun
Beanbun是一款使用php編寫的多進程網絡爬蟲框架,具有良好的開放性和高可擴展性,Beanbun遵循PSR-4標準,且支持守護進程與普通進程、支持內存、Redis隊列、支持廣度優先和深度優先、支持自定義URI過濾。
2.PHPCrawl
PHPCrawl是一款開源的php Web檢索爬蟲類庫,使用PHPCrawl可以選擇性指定爬蟲的行為,如內容類型,過濾器、 cookie的處理等方式。
3.phpspider
phpspider是一個爬蟲開發框架,其是利用框架封裝的多進程Worker類庫,代碼簡潔,執行效率高,使用phpspider可以快速的創建一個爬蟲。