您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關python爬蟲獲取cookie的方法,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
Cookie,指某些網站為了辨別用戶身份、進行session跟蹤而儲存在用戶本地終端上的數據(通常經過加密)。 比如說有些網站需要登錄后才能訪問某個頁面,在登錄之前,你想抓取某個頁面內容,登陸前與登陸后是不同的,或者不允許的。
在python中它為我們提供了cookiejar模塊,它位于http包中,用于對Cookie的支持。通過它我們能捕獲cookie并在后續連接請求時重新發送,比如可以實現模擬登錄功能。該模塊主要的對象有CookieJar、FileCookieJar、MozillaCookieJar、LWPCookieJar。
cookie的獲取方法
## cookie的獲取 # -*- coding: UTF-8 -*- from urllib import request from http import cookiejar if __name__ == '__main__': #聲明一個CookieJar對象實例來保存cookie cookie = cookiejar.CookieJar() #利用urllib.request庫的HTTPCookieProcessor對象來創建cookie處理器,也就CookieHandler handler=request.HTTPCookieProcessor(cookie) #通過CookieHandler創建opener opener = request.build_opener(handler) #此處的open方法打開網頁 response = opener.open('http://www.baidu.com') #打印cookie信息 for item in cookie: print('Name = %s' % item.name) print('Value = %s' % item.value)
關于python爬蟲獲取cookie的方法就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。