中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

【python小項目】抓取編程網收費vip文章的非vip用戶觀看界面的url

發布時間:2020-07-24 23:29:09 來源:網絡 閱讀:396 作者:老肖的博客 欄目:編程語言


#!/usr/bin/python3
#coding=UTF-8
import?requests
from?bs4?import?BeautifulSoup

'''
需求:【python小項目】抓取編程網收費vip文章的非vip用戶觀看界面的url!?例如收費文章http://c.biancheng.net/view/vip_6005.html對應非收費地址是http://c.biancheng.net/view/5315.html這個網站總是有一些vip文章??但是vip文章通過百度標題是可以搜索到的,我想爬取所有這樣的文章標題和網頁的地址!后期看到一個vip文章,你可以通過檢索標題得到非vip的觀看鏈接地址
編寫日期:2019-10-18
作者:xiaoxiaohui
說明:python3程序?而且最好在linux運行?windows下有gbk那個編碼問題
'''

def?get_biaoti(url):
	response?=?requests.get(url)
	response.encoding='utf-8'?#如果不設置成utf8則中文亂碼或者報錯?參考https://www.cnblogs.com/supery007/p/8303472.html
	soup?=?BeautifulSoup(response.text,'html.parser')
	links_div?=?soup.find_all('h2')
	return?links_div[0].text

f?=?open("a1.txt",?'a')
for?yema?in?range(1,500):
	url?=?'http://c.biancheng.net/view/'+str(yema)+'.html'
	biaoti?=?get_biaoti(url)
	print(url,biaoti)?
	f.write(url+'\t'+biaoti+'\n')
f.close()


運行結果、收集到的文章和url對應關系截圖:

【python小項目】抓取編程網收費vip文章的非vip用戶觀看界面的url

自己學到的:

  1. 這次學到的? 原來我的爬蟲都是爬某個div的,都是links_div = soup.find_all('div',class_="listpic"), 原來也可以直接links_div = soup.find_all('h2'),也就是帶一個參數這樣的




向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

库车县| 运城市| 本溪市| 咸阳市| 永州市| 耒阳市| 温州市| 慈溪市| 佛教| 贵德县| 攀枝花市| 都昌县| 旅游| 绥阳县| 杨浦区| 太原市| 清镇市| 文成县| 潮州市| 高雄县| 望江县| 夹江县| 叶城县| 嘉兴市| 古丈县| 米泉市| 正定县| 肥西县| 明水县| 东至县| 万年县| 上蔡县| 福州市| 新竹市| 江安县| 旬邑县| 宝丰县| 额尔古纳市| 神农架林区| 洮南市| 宁海县|