中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Node.js實現簡單的爬取的示例代碼

發布時間:2020-08-25 17:49:16 來源:腳本之家 閱讀:137 作者:毛寸頭少年* 欄目:web開發

學習【node.js】也有幾天時間了,所以打算寫著練練手;索然我作為一個后端的選手,寫起來還有那么一絲熟悉的感覺。emmm~~ ‘貨'不多講 ,開搞........

首先是依賴選擇:

Node.js實現簡單的爬取的示例代碼

代碼塊如下:

//引入依賴

//https請求

const https = require('https');

//簡稱node版的jquery

const cheerio = require('cheerio');

//解決防止出現亂碼

const iconv = require('iconv-lite')

//http請求

const request = require("request");

//負責讀寫文件

const fs = require('fs');

//處理文件路徑

const path = require('path');

爬取路徑:

Node.js實現簡單的爬取的示例代碼

代碼塊:(PS:這里單獨拿出來是因為這個站的素材比較推薦,可以上去瞅瞅~~)

const url = 'https://unsplash.com/';

初步實現:

網站的基本構成

Node.js實現簡單的爬取的示例代碼

這里主要是我們直接確認一下需要的【img】標簽,以及外面的【figure】,然后直接就可以開工了....

核心代碼:

//方法對象

const util = {

 

  getsrc: function (url) {

    https.get(url, res => {

      const chunks = [];

      res.on('data', chunk => {

        // chunks里面存儲著網頁的html內容

        chunks.push(chunk);

      });

      res.on('end', e => {

 

        let ALL = [];

        //編碼格式

        let html = iconv.decode(Buffer.concat(chunks), 'utf8');

        let $ = cheerio.load(html, { decodeEntities: false });

 

        //標簽遍歷

        $("figure img").each(function (idex, elent) {

          let $elent = $(elent);

          let $srcset = $elent.attr("srcset");

          if ($srcset != undefined) {

            let src = ($srcset.split(',').pop()).split('?')[0];

            ALL.push({

              src: src

            })

          }

        });

        //遍歷數組 每個后面加.jpg

        ALL.forEach(item => {

          util.downloadimg(item.src, path.basename(item.src) + ".jpg", function () {

            console.log(path.basename(item.src) + ".jpg");

          });

        })

      });

 

      res.on('error', e => {

        console.log('Error: ' + e.message);

      });

    });

  },

 

  //運行主函數

  main: function () {

    console.log("------start--------");

    util.getsrc(url);

  },

  //下載圖片函數

  downloadimg: function (src, srcname, callback) {

 

    //http請求

    request.head(src, function (err, res, body) {

      if (err) {

        console.log('err:' + err);

        return false;

      }

      console.log('res: ' + res);

      //保存數據,這里是防止未來得及記錄數據又開始讀取數據而導致數據丟失

      request(src).pipe(fs.createWriteStream('./img/' + srcname)).on('close', callback);

    });

  }

}

 

//主函數

util.main();

然后就可以運行 node xxx.js 看運行結果。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

青州市| 莲花县| 府谷县| 巧家县| 日喀则市| 溧阳市| 红安县| 德保县| 麦盖提县| 阿克苏市| 龙山县| 左云县| 阳山县| 股票| 张家界市| 乌鲁木齐市| 蓝山县| 体育| 绥中县| 安吉县| 连州市| 绵竹市| 新巴尔虎左旗| 文昌市| 德安县| 繁昌县| 土默特左旗| 大城县| 和顺县| 武威市| 雅安市| 南汇区| 武胜县| 宁海县| 山丹县| 新密市| 澎湖县| 东明县| 海淀区| 樟树市| 灵台县|