中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么使用node.js爬取知乎圖片

發布時間:2022-04-01 10:38:20 來源:億速云 閱讀:166 作者:iii 欄目:編程語言

這篇文章主要介紹了怎么使用node.js爬取知乎圖片的相關知識,內容詳細易懂,操作簡單快捷,具有一定借鑒價值,相信大家閱讀完這篇怎么使用node.js爬取知乎圖片文章都會有所收獲,下面我們一起來看看吧。

原理

初入爬蟲的坑,沒有太多深奧的理論知識,要獲取知乎上帖子中的一張圖片,我把它歸結為以下幾步。

  • 準備一個url

  • 獲取這個url的html內容,并分析其中的dom結構,遍歷找到這些漂亮的妹紙圖片url

  • 獲取圖片內容

  • 將圖片內容寫入本地文件

開始動手

大概知道原理之后我們就可以開干了

準備一個url

這個最簡單了,去知乎隨便一搜就是一大把,我們以

發一張你認為很漂亮的美女照片?

為例子,先來分析一下這個頁面的dom結構,其實很簡單,知乎的一個頁面中會包含很多種類型的圖片,有頭像,用戶評價上傳的圖片啥的。基本上在noscript種都可以找到對應的圖片地址。

怎么使用node.js爬取知乎圖片

獲取這個url的html內容,并且拿到當前頁面noscript中的img鏈接

這一步我們需要會點簡單的nodejs的知識,以及用到一個庫叫cheerio,這個庫具體是用來做什么的,詳細請移步cheerio。

簡單來說就是可以在命令行中使用jQuery來搜索遍歷獲取相應的元素。

那么怎樣才能獲取這個帖子的html呢

使用nodejs的https模塊

var https = require('https')
getAllHtml (url, callback) {
 let sHtml = '',
 _this = this;
 https.get(url, (res) => {
 res.on('data', (data) => {
 sHtml += data;
 });
 res.on('end', () => {
 callback.bind(_this, sHtml)();
 })
 }).on('error', (err) => {
 console.log(err);
 });
}

通過以上操作拿到網站的html之后,便是遍歷出我們需要的圖片地址來了

filterHtml (sHtml, filePath) {
 let $ = cheerio.load(sHtml), // 將上一步拿到的網站html傳入cheerio.load,便得到類似于包裝過的jQuery對象,可以像jQuey的選擇器一樣來選擇元素
 $Imgs = $('noscript img'),
 imgData = [],
 _this = this;
 $Imgs.each((i, e) => {
 let imgUrl = $(e).attr('src'); //取出對應的url
 imgData.push(imgUrl);
 // 將url傳入開始下載
 _this.downloadImg(imgUrl, _this.filePath, 
 function (err) {
 console.log(imgUrl + 'has be down');
 });
 });
 console.log(imgData);
}

有了圖片的url,如何下載到本地呢?

我們需要使用request這個庫,簡單的調用一下api再結合node原生寫文件的api。

downloadImg (imgUrl, filePath, callback) {
 let fileName = this.parseFileName(imgUrl);
 request(imgUrl).pipe(fs.createWriteStream('./' + filePath + '/'+fileName)).on('close', callback && callback);
 }

關于“怎么使用node.js爬取知乎圖片”這篇文章的內容就介紹到這里,感謝各位的閱讀!相信大家對“怎么使用node.js爬取知乎圖片”知識都有一定的了解,大家如果還想學習更多知識,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

陵川县| 丹凤县| 九台市| 沂源县| 达州市| 衡阳市| 东山县| 天津市| 江永县| 通化县| 佛坪县| 孟津县| 托里县| 淮安市| 柞水县| 伊宁县| 正镶白旗| 常宁市| 南华县| 循化| 北川| 桐柏县| 蓝山县| 津市市| 德钦县| 营山县| 聂荣县| 梅州市| 南城县| 盘山县| 张北县| 呼图壁县| 昌都县| 长兴县| 阜平县| 洛南县| 聊城市| 竹北市| 晋宁县| 泗水县| 长武县|