您好,登錄后才能下訂單哦!
使用Python爬蟲怎么實現驗證碼登錄?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
import re import urllib.request import http.cookiejar #from http.comkie import CookieJar 上面那句和這句等同 loginurl='https://www.douban.com/accounts/login' cookie = http.cookiejar.CookieJar() opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor)#在已存的Cookie下建立連接 params={} params['form_email']='用戶名' params['form_password']='密碼'#這里寫上已有的用戶名和密碼 params['source']='http://www.douban.com/accounts/login' #從首頁提交登陸 response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))#urllib.parse.urlencode(params).encode('utf-8')這個是向服務 #器POST的內容,可以打印一下response.geturl()請求的連接看一下 #print(response.geturl()[0:33]) #驗證成功跳轉至登陸頁 if response.geturl()[0:33]=='https://accounts.douban.com/login': html = response.read().decode('utf-8') #print(html),可以先打印一下文件內容,為了看到網頁元素更方便的寫正則,可以復制下來,在需要獲取的地方用(.+?)表示,然后用group()元組來取得, #驗證圖片地址 imgurl=re.search('<img id="captcha_image" src="(.+?)" alt="captcha" class="captcha_image"/>',html) if imgurl: url=imgurl.group(1) #print(url) #將驗證碼以v.jpg保存在本地,在輸入驗證碼的時候可以手工輸入 res=urllib.request.urlretrieve(url,'v.jpg') captcha = re.search('<input type="hidden" name="captcha-id" value="(.+?)"/>',html) #print(captcha.group(1)) if captcha: vcode=input('請輸入圖片上的驗證碼:') params["captcha-solution"] = vcode params["captcha-id"] = captcha.group(1)#這個是動態生成的,需要從網頁中獲得 params["user_login"] = "登錄" #提交驗證碼驗證 response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8')) if response.geturl()=="https://www.douban.com/": print("login sucess")
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。