中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何利用Python爬蟲爬取網站音樂

發布時間:2021-09-15 17:36:14 來源:億速云 閱讀:396 作者:小新 欄目:編程語言

小編給大家分享一下如何利用Python爬蟲爬取網站音樂,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

具體實現

1.引入發送網絡請求的第三方庫

import requests # 發送網絡請求的第三方庫

安裝方法

pip install requests

2.引入數據解析第三方庫

from lxml import etree # 數據解析第三方庫

安裝方法

pip install lxml

3.某易云音樂網站列表url為'https://music.163.com/#/discover/toplist?id=3778678'

url = 'https://music.163.com/#/discover/toplist?id=3778678'

4.發送請求獲取頁面數據

response = requests.get(urlurl=url) # 請求頁面數據

5.解析數據

html=etree.HTML(response.text) # 解析頁面數據

6.獲取所有歌曲標簽集合( a標簽 )

id_list = html.xpath('//a[contains(@href,"song?")]')  # 所有歌曲id集合

7.下載歌曲

base_url = 'http://music.163.com/song/media/outer/url?id=' # 下載音樂網址前綴  # 下載音樂url = 網址前綴 + 音樂id  for data in id_list:      href = data.xpath('./@href')[0]      music_id = href.split('=')[1] # 音樂id      music_url = base_url + music_id # 下載音樂url      music_name = data.xpath('./text()')[0] # 下載音樂名稱      music = requests.get(url = music_url)      # 將下載的音樂以文件形式保存下來      with open('./music/%s.mp3' % music_name, 'wb') as file:           file.write(music.content)           print('<%s>下載成功' % music_name)

遇到的坑

以上的方法我是從一個視頻里學到的,那個視頻是半年前出的,可能當時這種方法還好使,但是今天我在用這種方法下載音樂文件的時候突然就報錯了。

首先,編輯器報錯找不到 music_name 和 music_id ,我仔細一看,獲取的id_list集合里(也就是標簽集合里)的id根本不是id,是代碼,估計在這里音樂網站也做了相應的反扒機制。

其次,我自己在網站里找到了一首音樂獲取了它的id并把id賦值給music_id,結果當用外鏈下載音樂時報錯460,顯示網絡擁擠,估計下載音樂的網址也不好使了。

base_url = 'http://music.163.com/song/media/outer/url?id='  music_id = '1804320463.mp3'  music_url = base_url + music_id  music = requests.get(url=music_url)  print(music.text)

{"msg":"網絡太擁擠,請稍候再試!","code":-460,"message":"網絡太擁擠,請稍候再試!"}

最后,我打印出music_url,點擊進去,還是可以聽歌和下載的,不知道這是為什么了

base_url = 'http://music.163.com/song/media/outer/url?id='  music_id = '1804320463.mp3'  music_url = base_url + music_id  # music = requests.get(url=music_url)  print(music_url)

以上是“如何利用Python爬蟲爬取網站音樂”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

乌恰县| 阿巴嘎旗| 竹山县| 大冶市| 保山市| 西乌| 叶城县| 千阳县| 禄劝| 泾源县| 中西区| 绥宁县| 磐安县| 阿勒泰市| 文昌市| 凉城县| 台南县| 纳雍县| 沅江市| 保亭| 渑池县| 日喀则市| 大石桥市| 罗田县| 喜德县| 德惠市| 高邮市| 沂源县| 铜梁县| 玛纳斯县| 紫阳县| 措勤县| 六盘水市| 平塘县| 陆良县| 新化县| 繁昌县| 长泰县| 平阴县| 吕梁市| 平乐县|