您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關Python獲取cookie的作用是什么,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。
cookie是什么?
Cookie,指某些網站為了辨別用戶身份、進行session跟蹤而儲存在用戶本地終端上的數據(通常經過加密)。在web開發中,經常需要對會話進行跟蹤。因為http請求是無狀態協議,也就是說僅僅通過http,服務器無法區分出不同的客戶端。也就是說你訪問這個頁面之后,在刷新一次,沒有cookie的話,服務器完全不知道現在刷新的和剛才訪問的是同一用戶,它都當作是新的請求來處理,所以這就帶來了一定的不方便。特別是需要登錄的頁面,總不能每個頁面都登錄一次,每刷新一次就要登錄一次吧。也就是說需要某種機制來增強http協議,使得服務器可以區分出這是同一個客戶端。而這個機制就是cookie。
cookie如何工作
當你第一次訪問某個網站的時候,服務器會給你頒發一個特定的cookie,之后你每次訪問這個站點,你發送的請求頭里都會帶上相應的cookie,這樣服務器便知道這倆請求是同一個客戶發送的。
第一次訪問某個網站,服務器會給你個cookie,response headers里有一個set-cookie 字段,就是告訴瀏覽器,把這個cookie放到本地,以后訪問我這個站點的時候,都把這個cookie帶上,我就知道你是誰了。
然后刷新頁面,相當于第二次訪問
會發現,第二次訪問的時候,response headers里邊已經沒有這個set cookie字段了,但是request headers 里多了一個cookie字段,而且仔細觀察的話,你會發現這個值恰恰就是剛剛response headers set cookie字段的值。其實只要你不關閉瀏覽器,在打開一個窗口你會發現這個cookie值還是這個,默認情況下,關掉瀏覽器或者換一個瀏覽器,服務器就認為這是一個新的會話了。而cookie的保存時間是可以設定的,你會發現知乎,簡書等網站,只要你登陸成功之后,即使關閉瀏覽器,過幾天之后還是登陸狀態,說明這個cookie是一個持久的cookie,保存時間比較長。
從上述倆張圖,可以發現cookie是實實在在存在于http請求和響應報頭的。
如何用python實現cookie登陸
既然大概明白了cookie機制,我們就嘗試用cookie進行登陸。以登陸知乎為例,如果你用賬號密碼登陸,驗證碼是個大問題,起碼目前對我來說是這樣,所以你先用瀏覽器手動登陸知乎。右鍵進入開發者選項,network,選擇www.zhihu.com,查看請求頭信息。
然后把cookie復制下來,可以開始寫代碼了。
import requests from bs4 import BeautifulSoup headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36', 'Referer':'https://www.zhihu.com/', 'Cookie':'q_c1=36160dc56c7d4cf3af14559e4ea69ed1|1508646188000|1508646188000; q_c1=e1adb01bc55343c0b61e0d4e08f73344| 1508646188000|1508646188000; _zap=7926df57-02e2-45a7-9244-85ff9156e100; d_c0="ABACCuGPkwyPTgYydZLhc0-YwrldDeOJ3_w=| 1508841150"; r_cap_id="NjE4YWExOTIxM2YwNGVlODhmNjc5ZDE3MGQyNWM0MjM=|1508844066| 4207fbc525684854cb948b64e10a3c693a999056"; cap_id="YzRhYmM5YTJhZWM4NGFiYWExOGYzOTU1ZjczMGMyOGI=|1508844066| a828518b3a798b99e4ea0cd6a54f25dc31d70c6d"; z_c0=Mi4xTk5WX0FnQUFBQUFBRUFJSzRZLVREQmNBQUFCaEFsVk5zM0RjV2dDWEhfTS16TmV1 dk80dTVZSnpqOGNpX3NpblF3|1508844211|c34b0d4374988f038beedfa2cbcd48e2271a0c66; __utma=51854390.9389312.1508841151. 1508841151.1508843285.2; __utmz=51854390.1508841151.1.1.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; __utmv=51854390. 100-1|2=registration_date=20160120=1^3=entry_date=20160120=1; aliyungf_tc=AQAAAB0uB1XAWQIAE7YKcClINzXafvOI; _xsrf=3283d7f2-8e92-4b94-9b0e-1105c2d069d0' } res=requests.get("https://www.zhihu.com/search?type=content&q=java",headers=headers) soup=BeautifulSoup(res.text,'html.parser') n=soup.select(".list")[0].select(".item")
可以發現,已經抓到了本來需要登陸才能看的頁面,而如果去掉請求頭里的cookie字段,會幫你重定向到登陸頁面。
關于Python獲取cookie的作用是什么就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。