您好,登錄后才能下訂單哦!
本篇文章為大家展示了帶你了解Python 的requests 模塊,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
Python requests 模塊
requests 模塊是我們使用的 python爬蟲 模塊 可以完成市場進80%的爬蟲需求。
安裝
pip install requests
使用
requests模塊代碼編寫的流程:
-------------案例------------------------- import requests # 指定url url="https://www.sogou.com/" # 發起請求 response = requests.get(url) # 獲取響應對象中的數據 page_text = response.text # 持久化存儲 with open('./sogou.html','w',encoding='utf-8') as fp: fp.write() -------------------------------------------
參數
# post 數據 response = requests.post(url=url,data=data,headers=headers) # get 數據 response = requests.get(url=url,data=data,headers=headers) # 返回二進制數據 response.content # 返回字符串數據 response.text # 返回json對象 response.json()
其他了解
1、該模塊實現爬取數據前需要查找需要爬取數據的指定URL,可通過瀏覽器自帶抓包功能。
# 瀏覽器抓取 Ajax 請求 F12 --> Network --> XHR --> Name --> Response
2、上面的headers參數是進行UA偽裝為了反反爬
反爬機制:UA檢測 --> UA偽裝
3、下面是http我們爬包是常用的請求頭參數
- accept: 瀏覽器通過這個頭告訴服務器,他所支持的數據類型 - Accept-Charset:瀏覽器通過這個頭告訴服務器,它支持那種字符集 - Accept-Encoding:瀏覽器通過這個頭告訴服務器,支持的壓縮格式 - Accept-Language:瀏覽器通過這個頭告訴服務器,他的語言環境 - Host:瀏覽器同過這個頭告訴服務器,想訪問哪臺主機 - If-ModifiedSince:瀏覽器通過這個頭告訴服務器,緩存數據的時間 - Heferer:瀏覽器通過這個頭告訴服務器,客戶及時那個頁面來的,防盜鏈 - Connection:瀏覽器通過這個頭告訴服務器,請求完后是斷開鏈接還是保持鏈接 - X-Requested-With:XMLHttpRequest 代表通過ajax方式進行訪問 - User-Agent:請求載體的身份標識
上述內容就是帶你了解Python 的requests 模塊,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。