中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

帶你了解Python 的requests 模塊

發布時間:2020-10-28 18:13:30 來源:億速云 閱讀:159 作者:Leah 欄目:開發技術

本篇文章為大家展示了帶你了解Python 的requests 模塊,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

Python requests 模塊

  requests 模塊是我們使用的 python爬蟲 模塊 可以完成市場進80%的爬蟲需求。

安裝

pip install requests

使用

requests模塊代碼編寫的流程:

  • - 指定url
  • - 發起請求
  • - 獲取響應對象中的數據
  • - 持久化存儲
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 發起請求
response = requests.get(url)
# 獲取響應對象中的數據
page_text = response.text
# 持久化存儲
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

參數

# post 數據
response = requests.post(url=url,data=data,headers=headers)

# get 數據
response = requests.get(url=url,data=data,headers=headers)

# 返回二進制數據
response.content 

# 返回字符串數據  
response.text  

# 返回json對象   
response.json()

其他了解

1、該模塊實現爬取數據前需要查找需要爬取數據的指定URL,可通過瀏覽器自帶抓包功能。

# 瀏覽器抓取 Ajax 請求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers參數是進行UA偽裝為了反反爬

反爬機制:UA檢測 --> UA偽裝

3、下面是http我們爬包是常用的請求頭參數

- accept: 瀏覽器通過這個頭告訴服務器,他所支持的數據類型
  - Accept-Charset:瀏覽器通過這個頭告訴服務器,它支持那種字符集
  - Accept-Encoding:瀏覽器通過這個頭告訴服務器,支持的壓縮格式
  - Accept-Language:瀏覽器通過這個頭告訴服務器,他的語言環境
  - Host:瀏覽器同過這個頭告訴服務器,想訪問哪臺主機
  - If-ModifiedSince:瀏覽器通過這個頭告訴服務器,緩存數據的時間
  - Heferer:瀏覽器通過這個頭告訴服務器,客戶及時那個頁面來的,防盜鏈
  - Connection:瀏覽器通過這個頭告訴服務器,請求完后是斷開鏈接還是保持鏈接
  - X-Requested-With:XMLHttpRequest 代表通過ajax方式進行訪問
  - User-Agent:請求載體的身份標識

上述內容就是帶你了解Python 的requests 模塊,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

同仁县| 蚌埠市| 且末县| 江源县| 金溪县| 五寨县| 峨眉山市| 南汇区| 桐梓县| 茶陵县| 平遥县| 子长县| 淮北市| 齐河县| 化州市| 青海省| 和林格尔县| 桐城市| 无锡市| 东明县| 北安市| 玉环县| 长兴县| 砀山县| 衢州市| 绥化市| 富川| 会宁县| 三江| 陕西省| 新邵县| 徐汇区| 青铜峡市| 洛隆县| 平度市| 兴和县| 嘉峪关市| 永定县| 红河县| 河南省| 乐都县|