要使用BeautifulSoup查找指定標簽,首先需要導入庫并創建一個BeautifulSoup對象來解析網頁內容。然后可以使用find()或find_all()方法來查找指定的標簽。
例如,如果想查找所有的
標簽,可以這樣做:
from bs4 import BeautifulSoup
html = """
<html>
<head>
<title>Example</title>
</head>
<body>
<p>Paragraph 1</p>
<p>Paragraph 2</p>
</body>
</html>
"""
soup = BeautifulSoup(html, 'html.parser')
paragraphs = soup.find_all('p')
for p in paragraphs:
print(p.text)
在上面的例子中,我們首先創建了一個BeautifulSoup對象soup來解析html內容。然后使用find_all(‘p’)方法找到所有的
標簽,并將其存儲在一個列表中。最后,使用一個循環打印出每個
標簽的文本內容。
除了標簽名外,還可以使用其他屬性來查找指定的標簽。例如,如果要查找所有class為’example’的
divs = soup.find_all('div', class_='example')