是的,Python 網頁爬蟲可以抓取視頻。可以使用第三方庫如 requests
和 BeautifulSoup
來下載和解析網頁,然后使用 ffmpeg
等工具將視頻保存到本地。
以下是一個簡單的示例代碼,展示如何使用 Python 抓取網頁上的視頻并保存到本地:
import requests
from bs4 import BeautifulSoup
import re
import os
import subprocess
def download_video(url, output_path):
response = requests.get(url)
with open(output_path, 'wb') as f:
f.write(response.content)
def extract_video_url(html):
soup = BeautifulSoup(html, 'html.parser')
video_tags = soup.find_all('video')
video_urls = []
for tag in video_tags:
source_tag = tag.find('source')
if source_tag:
video_url = source_tag.get('src')
if video_url:
video_urls.append(video_url)
return video_urls
def main():
url = 'https://example.com' # 替換為目標網頁的 URL
output_directory = 'videos'
if not os.path.exists(output_directory):
os.makedirs(output_directory)
html = requests.get(url).text
video_urls = extract_video_url(html)
for i, video_url in enumerate(video_urls):
output_path = os.path.join(output_directory, f'video_{i}.mp4')
download_video(video_url, output_path)
print(f'Downloaded {video_url} to {output_path}')
if __name__ == '__main__':
main()
請注意,這個示例代碼僅適用于簡單的網頁結構,并且假設視頻 URL 直接包含在 <video>
標簽的 src
屬性中。對于更復雜的網頁結構,可能需要進一步解析和提取視頻 URL。此外,ffmpeg
需要安裝在系統中,以便將視頻文件保存到本地。