Scrapy可以通過Pipeline來導出數據,通過ItemLoader來導入數據。
導出數據:
ITEM_PIPELINES = {
'myproject.pipelines.MyPipeline': 300,
}
class MyPipeline:
def process_item(self, item, spider):
# 處理item數據,可以將數據保存到文件或數據庫中
return item
導入數據:
import scrapy
class MyItem(scrapy.Item):
name = scrapy.Field()
age = scrapy.Field()
from scrapy.loader import ItemLoader
from myproject.items import MyItem
def parse(self, response):
loader = ItemLoader(item=MyItem(), response=response)
loader.add_xpath('name', '//div[@class="name"]/text()')
loader.add_xpath('age', '//div[@class="age"]/text()')
yield loader.load_item()
以上就是通過Scrapy導入和導出數據的簡單示例。您可以根據需要修改和擴展這些示例來實現更復雜的數據導入和導出功能。