在BeautifulSoup中,要獲取標簽內的字符串內容可以使用.string
屬性或.get_text()
方法來實現。例如:
from bs4 import BeautifulSoup
html = """
<html>
<body>
<p>這是一個段落</p>
</body>
</html>
"""
soup = BeautifulSoup(html, 'html.parser')
p_tag = soup.find('p')
# 使用.string屬性獲取字符串內容
content = p_tag.string
print(content)
# 使用get_text()方法獲取字符串內容
content = p_tag.get_text()
print(content)
以上代碼會輸出:
這是一個段落
這是一個段落