您好,登錄后才能下訂單哦!
這篇文章主要介紹了python如何爬取Q房網數據,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
本文的文字及圖片來源于網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理
爬取Q房網數據
https://shenzhen.qfang.com/newhouse
爬取目標數據:
小區名字
售房狀態
房屋面積
戶型
開盤時間
交房時間
樓盤地址
售價
預計總價
emmmm,我看看就行了,買不起買不起
python 3.6.5
pycharm
導入工具
import requests import parsel import csv
解析網頁,爬取數據
for page in range(1, 84): print('===============================正在爬取第{}頁的數據================================================='.format(page)) url = 'https://shenzhen.qfang.com/newhouse/list/n{}'.format(page) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) selector = parsel.Selector(response.text) lis = selector.css('.list-result li') dit = {} for li in lis: title = li.css('.list-main-header a em::text').get() # 名字 dit['標題'] = title status = li.css('.list-main-header i::text').get() # 是否在售 dit['房產狀態'] = status space = li.css('.list-main div:nth-child(1) .space span::text').get() # 售房面積 dit['售房面積'] = space type_list = li.css('.list-main.fl p:nth-child(3) span a::text').getall() # 戶型 type_str = '|'.join(type_list).strip().replace('\r\n', '').replace(' ', '') # 戶型 dit['戶型'] = type_str kp_time = li.css('.new-house-info > div:nth-child(2) > p.space.fl.clearfix > span::text').get() # 開盤時間 dit['開盤時間'] = kp_time cs_time = li.css('.new-house-info > div:nth-child(2) > p:nth-child(3)> span::text').get() # 出售時間 dit['出售時間'] = cs_time address = li.css('.list-main a:nth-child(3)::text').get() # 地址 if not address == None: address = address.strip() else: address = None dit['地址'] = address Price = li.css('.list-price .bigger .amount::text').get() # 售價 dit['售價'] = Price hj_Price = li.css('.list-price .smaller::text').get() # 預計總價 dit['預計總價'] = hj_Price
保存數據
f = open('房產數據.csv', mode='a', encoding='utf-8-sig', newline='') csv_writer = csv.DictWriter(f, fieldnames=['標題', '房產狀態', '售房面積', '戶型', '開盤時間', '出售時間', '地址', '售價', '預計總價']) csv_writer.writeheader() print(dit)
運行代碼,效果如下圖
感謝你能夠認真閱讀完這篇文章,希望小編分享的“python如何爬取Q房網數據”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。