Scrapy如何處理XML和JSON數據

Scrapy提供了內置的XML和JSON解析器，可以方便地處理XML和JSON數據。

處理XML數據：使用Scrapy的Selector模塊可以輕松地處理XML數據。可以使用XPath表達式來選擇和提取需要的數據。例如：

from scrapy.selector import Selector

xml_data = """
<bookstore>
  <book category="cooking">
    <title lang="en">Everyday Italian</title>
    <author>Giada De Laurentiis</author>
    <year>2005</year>
    <price>30.00</price>
  </book>
  <book category="children">
    <title lang="en">Harry Potter</title>
    <author>J.K. Rowling</author>
    <year>2005</year>
    <price>29.99</price>
  </book>
</bookstore>
"""

selector = Selector(text=xml_data)
titles = selector.xpath('//book/title/text()').extract()
authors = selector.xpath('//book/author/text()').extract()

for title, author in zip(titles, authors):
    print(f"Title: {title}, Author: {author}")

處理JSON數據： Scrapy提供了內置的JsonResponse類來處理JSON數據。可以使用json()方法將Response對象轉換為Python字典，然后直接操作字典獲取需要的數據。例如：

import json

json_data = """
{
  "bookstore": {
    "books": [
      {
        "title": "Everyday Italian",
        "author": "Giada De Laurentiis",
        "year": 2005,
        "price": 30.00
      },
      {
        "title": "Harry Potter",
        "author": "J.K. Rowling",
        "year": 2005,
        "price": 29.99
      }
    ]
  }
}
"""

response_dict = json.loads(json_data)

for book in response_dict['bookstore']['books']:
    print(f"Title: {book['title']}, Author: {book['author']}")

通過以上方法，可以方便地處理XML和JSON數據，并提取需要的信息。

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

最新問答

相關標簽