中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python基于BeautifulSoup和requests實現的爬蟲功能示例

發布時間:2020-09-03 10:42:03 來源:腳本之家 閱讀:140 作者:郭大俠寫leetcode 欄目:開發技術

本文實例講述了Python基于BeautifulSoup和requests實現的爬蟲功能。分享給大家供大家參考,具體如下:

爬取的目標網頁:http://www.qianlima.com/zb/area_305/

Python基于BeautifulSoup和requests實現的爬蟲功能示例

這是一個招投標網站,我們使用python腳本爬取紅框中的信息,包括鏈接網址、鏈接名稱、時間等三項內容。

使用到的Python庫:BeautifulSoup、requests

代碼如下:

# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
url = 'http://www.qianlima.com/zb/area_305/'
user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'
headers = { 'User-Agent' : user_agent}
r = requests.get(url,headers=headers)#連接
content = r.text#獲取內容,自動轉碼unicode
soup = BeautifulSoup(content,"lxml")
tags1 = soup.select('div .shixian_zhaobiao')
tag1 = tags1[0]
tag2 = tag1.find(name = 'dl')
tags2 = tag2.find_all(name = 'a')
tags3 = tag2.find_all(name = 'dd')
for tag in tags2:
 print tag.get('href')
 print tag.string
 print tag.next_element.next_element.string

運行結果如下

Python基于BeautifulSoup和requests實現的爬蟲功能示例

更多關于Python相關內容可查看本站專題:《Python Socket編程技巧總結》、《Python正則表達式用法總結》、《Python數據結構與算法教程》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經典教程》及《Python文件與目錄操作技巧匯總》

希望本文所述對大家Python程序設計有所幫助。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

乐至县| 桃江县| 高碑店市| 射洪县| 高清| 高雄县| 兴山县| 新闻| 青阳县| 千阳县| 亳州市| 隆德县| 内丘县| 洪泽县| 东阿县| 来宾市| 林周县| 张北县| 牙克石市| 太康县| 井研县| 静安区| 东至县| 都昌县| 老河口市| 宜城市| 云霄县| 阿城市| 巴彦淖尔市| 开鲁县| 略阳县| 马尔康县| 岳池县| 武穴市| 玉田县| 武陟县| 太仆寺旗| 浑源县| 凤冈县| 探索| 岳西县|