中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python怎么抓取糗事百科的內容

發布時間:2021-07-09 16:59:50 來源:億速云 閱讀:116 作者:chen 欄目:大數據

這篇文章主要講解了“python怎么抓取糗事百科的內容”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“python怎么抓取糗事百科的內容”吧!

# 抓取糗事百科的內容
import requests
from lxml import etree
class Qiushi() :
	def __init__(self) : 
		self.url = 'http://www.qiushibaike.com/8hr/page/{}';
		self.headers = {
			"User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1 Trident/5.0;"
		};

	def parse_url(self , url) : 
		response = requests.get(url , timeout = 10 , headers = self.headers)
		assert response.status_code == 200
		print(url)
		return etree.HTML(response.text)

	def parse_content(self , html) : 
		item = html.xpath('//div[@class="recommend-article"]/ul/li')
		print(item)
		for i in item : 
			# 內容 
			print(i.xpath('./div/a[@class="recmd-content"]/text()'));
			# 好笑數
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[1]/text()'))
			# 評論數
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[4]/text()'))
			# 用戶名
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/span/text()'))
			# 頭像地址
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/img/@src'))


	def run(self) : 
		url = self.url.format(1);
		html = self.parse_url(url);
		self.parse_content(html);

if __name__ == '__main__': 
	qiu = Qiushi();
	qiu.run();

感謝各位的閱讀,以上就是“python怎么抓取糗事百科的內容”的內容了,經過本文的學習后,相信大家對python怎么抓取糗事百科的內容這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

湘阴县| 雷波县| 武冈市| 弋阳县| 海丰县| 彭泽县| 化隆| 大方县| 普洱| 万州区| 仙居县| 高雄县| 朝阳县| 湖北省| 新兴县| 阿尔山市| 嘉鱼县| 旺苍县| 巴里| 隆安县| 苍山县| 合山市| 广宁县| 米易县| 高州市| 清流县| 华安县| 阿拉善盟| 奈曼旗| 拉萨市| 麻栗坡县| 南岸区| 金坛市| 阿荣旗| 宣城市| 黄大仙区| 攀枝花市| 大丰市| 大邑县| 策勒县| 平遥县|