在Scrapy中實現定時任務可以通過使用第三方定時任務調度庫來實現,比如celery或者APScheduler等。以下是使用APScheduler來實現定時任務的示例代碼:
pip install apscheduler
import scrapy
from apscheduler.schedulers.twisted import TwistedScheduler
class MySpider(scrapy.Spider):
name = 'my_spider'
def __init__(self):
self.scheduler = TwistedScheduler()
self.scheduler.add_job(self.my_task, 'interval', minutes=1)
self.scheduler.start()
def my_task(self):
# 定時任務邏輯
self.logger.info('定時任務執行中...')
def parse(self, response):
pass
SPIDER_MODULES = ['my_project.spiders']
NEWSPIDER_MODULE = 'my_project.spiders'
scrapy crawl my_spider
這樣就可以在Scrapy中實現定時任務了。定時任務將會在Spider啟動后每隔一分鐘執行一次。