中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python使用requests及BeautifulSoup構建爬蟲實例代碼

發布時間:2020-09-27 21:21:28 來源:腳本之家 閱讀:179 作者:sober_qianyang 欄目:開發技術

本文研究的主要是Python使用requests及BeautifulSoup構建一個網絡爬蟲,具體步驟如下。

功能說明

在Python下面可使用requests模塊請求某個url獲取響應的html文件,接著使用BeautifulSoup解析某個html。

案例

假設我要http://maoyan.com/board/4貓眼電影的top100電影的相關信息,如下截圖:

Python使用requests及BeautifulSoup構建爬蟲實例代碼

獲取電影的標題及url。

安裝requests和BeautifulSoup

使用pip工具安裝這兩個工具。

pip install requests

Python使用requests及BeautifulSoup構建爬蟲實例代碼

pip install beautifulsoup4

Python使用requests及BeautifulSoup構建爬蟲實例代碼

程序

__author__ = 'Qian Yang'
# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
def get_one_page(url):
  response= requests.get(url)
  if response.status_code == 200:
    return response.content.decode("utf8","ignore").encode("gbk","ignore")
#采用BeautifulSoup解析
def bs4_paraser(html):
  all_value = []
  value = {}
  soup = BeautifulSoup(html,'html.parser')
  # 獲取每一個電影
  all_div_item = soup.find_all('div', attrs={'class': 'movie-item-info'})
  for r in all_div_item:
    # 獲取電影的名稱和url
    title = r.find_all(name="p",attrs={"class":"name"})[0].string
    movie_url = r.find_all('p', attrs={'class': 'name'})[0].a['href']
    value['title'] = title
    value['movie_url'] = movie_url
    all_value.append(value)
    value = {}
  return all_value

def main():
  url = 'http://maoyan.com/board/4'
  html = get_one_page(url)
  all_value = bs4_paraser(html)
  print(all_value)

if __name__ == '__main__':
  main()

代碼測試可用,實現效果:

Python使用requests及BeautifulSoup構建爬蟲實例代碼

總結

以上就是本文關于Python使用requests及BeautifulSoup構建爬蟲實例代碼的全部內容,希望對大家有所幫助。感興趣的朋友可以繼續參閱本站其他相關專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

砀山县| 遂平县| 陆良县| 汕尾市| 新宾| 利川市| 章丘市| 秦皇岛市| 攀枝花市| 长垣县| 周至县| 民县| 合川市| 抚顺市| 邓州市| 阳泉市| 东平县| 阳山县| 榆中县| 平和县| 新密市| 松滋市| 津市市| 原阳县| 那坡县| 利川市| 如东县| 灵石县| 利辛县| 富裕县| 焉耆| 吴旗县| 嘉峪关市| 黄大仙区| 武清区| 泸定县| 天长市| 临西县| 尉犁县| 张家界市| 奈曼旗|