您好,登錄后才能下訂單哦!
這篇文章主要介紹了怎么建立代理Ip池,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
說明
1、首先獲取代理的json信息。
2、使用requests獲取整個頁面的text(字符串),然后使用split('\n') 將每行分割后形成的列表,方便該列表采用json.loads()方法,將每行的字符串轉換成json對象,最終取值。
實例
#!/usr/bin/env python3 # coding:utf-8 #lanxing import json import telnetlib import requests import random proxy_url = 'https://raw.githubusercontent.com/fate0/proxylist/master/proxy.list' # proxyList = [] #定義函數,驗證代理ip是否有效 def verify(ip,port,type): proxies = {} try: telnet = telnetlib.Telnet(ip,port=port,timeout=3) #用這個ip請訪問,3s自動斷開,返回tiemout except: print('unconnected') else: #print('connected successfully') # proxyList.append((ip + ':' + str(port),type)) proxies['type'] = type proxies['host'] = ip proxies['port'] = port proxiesJson = json.dumps(proxies) #保存到本地的proxies_ip.json文件 with open('proxies_ip.json','a+') as f: f.write(proxiesJson + '\n') print("已寫入:%s" % proxies) #定義函數,帶著url地址去獲取數據 def getProxy(proxy_url): response = requests.get(proxy_url) #print(type(response)) # 用split('\n') 將每一行分割之后組成的列表,消除換行影響 proxies_list = response.text.split('\n') for proxy_str in proxies_list: # 用json.loads()方法,將每一行的字符串轉換為json對象,最后取值 proxy_json = json.loads(proxy_str) host = proxy_json['host'] port = proxy_json['port'] type = proxy_json['type'] verify(host,port,type) #主函數,入口 if __name__ == '__main__': getProxy(proxy_url)
感謝你能夠認真閱讀完這篇文章,希望小編分享的“怎么建立代理Ip池”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。