您好,登錄后才能下訂單哦!
這期內容當中小編將會給大家帶來有關HTML如何解析模塊,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
這個就比較簡單了沒有什么好強調的,如果返回的json 就是直接按照鍵值取,如果是網頁就是用lxml模塊的html進行xpath解析。
from lxml import html
import json
class GetNodeList():
def __init__(self):
self.getdivxpath="//div[@class='demo']"
def use_xpath(self,source):
if len(source):
root=html.fromstring(source) #html轉換成dom對象
nodelist=root.xpath(self.getdivxpath)#對dom對象進行xpath解析
if len(nodelist):
return nodelist
return None
def use_json(self, source,keyname):
if len(source):
jsonstr=json.loads(source)
value=jsonstr.get(keyname) #根據具體的鍵值修改
if len(value):
return value
return None
上述就是小編為大家分享的HTML如何解析模塊了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。