在Python中使用xpath需要先安裝一個解析庫,常用的解析庫有lxml和html.parser,下面分別介紹它們的安裝和使用方法。
安裝lxml庫: 使用pip命令在命令行中安裝lxml庫:
pip install lxml
使用lxml解析庫進行xpath解析:
from lxml import etree
# 創建一個XML解析器
parser = etree.XMLParser()
# 解析XML字符串
xmlstr = """
<root>
<element>foo</element>
<element>bar</element>
</root>
"""
root = etree.fromstring(xmlstr, parser)
# 使用xpath選擇節點
elements = root.xpath('//element')
# 遍歷選擇的節點
for element in elements:
print(element.text)
安裝html.parser庫: 使用pip命令在命令行中安裝html.parser庫:
pip install html5lib
使用html.parser解析庫進行xpath解析:
from html.parser import HTMLParser
# 創建一個HTML解析器
parser = HTMLParser()
# 解析HTML字符串
htmlstr = """
<html>
<body>
<h1>Heading</h1>
<p>Paragraph</p>
</body>
</html>
"""
parser.feed(htmlstr)
# 獲取解析結果
root = parser.close()
# 使用xpath選擇節點
headings = root.xpath('//h1')
# 遍歷選擇的節點
for heading in headings:
print(heading.text)
注意:以上示例代碼中的XPath表達式是簡單的示例,實際中可以根據具體需求編寫更復雜的XPath表達式。