Python怎么爬取網站音樂素材

發布時間：2021-11-23 09:58:45 來源：億速云閱讀：286 作者：iii 欄目：大數據

本篇內容主要講解“Python怎么爬取網站音樂素材”，感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷，實用性強。下面就讓小編來帶大家學習“Python怎么爬取網站音樂素材”吧!

前言

基本開發環境

Python 3.6
Pycharm

一、確定需求

Python怎么爬取網站音樂素材

如果想要驗證這個鏈接是否是音頻的真實下載地址，可以復制鏈接粘貼到新的窗口中。

Python怎么爬取網站音樂素材

https://downsc.chinaz.net/Files/DownLoad/sound1/202102/s830.mp3

老思路了，復制鏈接中的某些參數在開發者工具中進行搜索，很明顯 s830 就是音頻的ID了。

搜索 s830 找到來源，發現網頁頁面中自帶有下載地址。獲取音頻下載地址之后需要自己拼接url。

網頁數據不復雜，相對而言還是比較簡單的。
1、請求當前網頁數據，獲取音頻地址以及音頻標題
2、保存下載就可以了

三、代碼實現

獲取音頻ID以及音頻標題

def main(html_url):
    html_data = get_response(html_url).text
    selector = parsel.Selector(html_data)
    lis = selector.css('#AudioList .container .audio-item')
    for li in lis:
        name = li.css('.name::text').get().strip()
        src = li.css('audio::attr(src)').get()
        audio_url = 'https:' + src
        save(name, audio_url)
        print(name, audio_url)

保存數據

def save(name, audio_url):
    header = {
        'Upgrade-Insecure-Requests': '1',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
    }
    audio_content = requests.get(url=audio_url, headers=header).content
    path = 'audio\\'
    if not os.path.exists(path):
        os.mkdir(path)
    with open(path + name + '.mp3', mode='wb') as f:
        f.write(audio_content)

這里想要重新給一個headers參數，不然會下載不了。代碼會一直運行，但是沒有反應

多線程爬取

if __name__ == '__main__':
    executor = concurrent.futures.ThreadPoolExecutor(max_workers=5)
    for page in range(1, 31):
        url = f'https://sc.chinaz.com/yinxiao/index_{page}.html'
        # main(url)
        executor.submit(main, url)

Python怎么爬取網站音樂素材

到此，相信大家對“Python怎么爬取網站音樂素材”有了更深的了解，不妨來實際操作一番吧！這里是億速云網站，更多相關內容可以進入相關頻道進行查詢，關注我們，繼續學習！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

Python怎么爬取網站音樂素材

前言

基本開發環境

相關模塊的使用

一、確定需求

三、代碼實現

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

Python怎么爬取網站音樂素材

前言

基本開發環境

相關模塊的使用

一、確定需求

三、代碼實現

猜你喜歡

最新資訊

相關推薦

相關標簽