要使用BeautifulSoup處理XML文檔中的XML Id屬性,可以通過指定屬性參數來獲取具有特定屬性的標簽。以下是一個示例代碼,演示如何處理XML文檔中的XML Id屬性:
from bs4 import BeautifulSoup
# 假設xml_data是包含XML文檔字符串的變量
xml_data = """
<root>
<div id="1">First div</div>
<div id="2">Second div</div>
<div id="3">Third div</div>
</root>
"""
# 使用BeautifulSoup解析XML文檔
soup = BeautifulSoup(xml_data, 'xml')
# 查找所有帶有id屬性的div標簽
div_tags = soup.find_all('div', id=True)
# 遍歷所有找到的div標簽
for tag in div_tags:
print(tag.get('id'), tag.text)
在這個示例中,首先將包含XML文檔字符串的變量傳遞給BeautifulSoup,指定解析器為’xml’。然后使用find_all方法查找所有帶有id屬性的div標簽,并通過遍歷這些標簽獲取其id屬性值和文本內容。