中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

使用python爬蟲怎么對圖片進行爬取

發布時間:2021-01-18 16:21:24 來源:億速云 閱讀:330 作者:Leah 欄目:開發技術

使用python爬蟲怎么對圖片進行爬取?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

1、spider原理

spider就是定義爬取的動作及分析網站的地方。
以初始的URL**初始化Request**,并設置回調函數。 當該request**下載完畢并返回時,將生成**response ,并作為參數傳給該回調函數。

2、實現python爬蟲爬取圖片

第一步:導入正則表達式模塊

import re # 導入正則表達式模塊
import requests # python HTTP客戶端 編寫爬蟲和測試服務器經常用到的模塊
import random # 隨機生成一個數,范圍[0,1]

第二步:使用定義函數的方法爬取圖片

def spiderPic(html, keyword):
  print('正在查找 ' + keyword + ' 對應的圖片,下載中,請稍后......')
  for addr in re.findall('"objURL":"(.*?)"', html, re.S): # 查找URL
    print('正在爬取URL地址:' + str(addr)[0:30] + '...') 
    # 爬取的地址長度超過30時,用'...'代替后面的內容
    try:
      pics = requests.get(addr, timeout=100) # 請求URL時間(最大10秒)
    except requests.exceptions.ConnectionError:
      print('您當前請求的URL地址出現錯誤')
      continue
    fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb') 
     # 下載圖片,并保存和命名
    fq.write(pics.content)
    fq.close()

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

隆林| 梅州市| 六盘水市| 合作市| 清水县| 淄博市| 靖江市| 渭南市| 广东省| 静海县| 南丰县| 大名县| 滁州市| 金昌市| 石城县| 华宁县| 肃北| 景宁| 绍兴县| 潍坊市| 乌兰察布市| 巴青县| 鲁甸县| 呼伦贝尔市| 五河县| 新民市| 云霄县| 中阳县| 孝义市| 绿春县| 凤阳县| 平阳县| 湟中县| 方正县| 织金县| 六枝特区| 视频| 丹棱县| 明星| 娄底市| 改则县|