您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關Python 如何實現解析xml文件,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。
1、獲取xml樹
import xml.etree.ElementTree as ET def getTree(xmlName): xmlName = xmlName.strip() try: tree = ET.parse(xmlName) except: tree = None print 'Analysis xml file fail,file name: {}'.format(xmlName) return tree
2、獲取根節點
def getRoot(tree): if tree is not None: root = tree.getroot() else: root = None print 'Get root fail' return root
3、查看根節點
def seeRoot(root): '''<country name="tan">我是小明</country>''' if root is not None: print 'root tag:', root.tag # 標簽(country) print 'root attrib:', root.attrib # 屬性(name="tan") print 'root text:', root.text # 文本(我是小明) print 'root tail:', root.tail # 尾字符串(未涉及)
4、從根開始遍歷樹
def traverseRoot(root): if root is not None: for label1 in root: print 'label1 tag:', label1.tag print 'label1 attrib:', label1.attrib print 'label1 text:', label1.text print 'label1 tail:', label1.tail print '==================' for label2 in label1: print 'label2 tag:', label2.tag print 'label2 attrib:', label2.attrib print 'label2 text:', label2.text print 'label2 tail:', label2.tail print '==================' for label3 in label2: print 'label3 tag:', label3.tag print 'label3 attrib:', label3.attrib print 'label3 text:', label3.text print 'label3 tail:', label3.tail print '=================='
5、找到2012年的gdppc和neighbor下的b標簽(找到同層有條件的同層另一個tag的文本)
def findYouNedd(root): '''查找year為2012下的b標簽的文本''' if root is not None: for label1 in root: for label2 in label1: if label1.tag == 'country' and label2.text == '2012': # 找到本層標簽為country且下一層有2012文本 print 'Find tag為country and next year=2012' for child in label1: if child.tag == 'gdppc': print child.text for youNeed in child: if youNeed.tag == 'b': print 'You need:', youNeed.text
6、查找父節點下的子節點
def findChildNode(fatherNode, childNode): childNode = childNode.strip() if fatherNode is not None: childs = fatherNode.findall(childNode) print childs print len(childs)
7、另一種辦法實現第4點
def findYouNedd2(root): countryNodes = root.findall('country') if root is not None: for countryNode in countryNodes: if countryNode.find('year').text == '2012': print countryNode.find('gdppc').text
8、移除節點
def delNode(tree, nodeName): nodeName = nodeName.strip() if tree is not None: root = tree.getroot() findNode = root.find(nodeName) if findNode is not None and findNode.tag == nodeName: root.remove(findNode) tree.write('removeNode.xml') # 移除節點后新的xml
9、xml樣例(xmlDemo.xml)
<?xml version="1.0"?> <data> <country name="Liechtenstein"> <rank>1</rank> <year>2008</year> <gdppc>141100</gdppc> <neighbor name="Austria" direction="E"/> <neighbor name="Switzerland" direction="W"/> </country> <country name="Singapore"> <rank>4</rank> <year>2011</year> <gdppc>59900</gdppc> <neighbor name="Malaysia" direction="N">123 <a name="a"> aaa </a> </neighbor> </country> <country name="Singapore"> <rank>68</rank> <year>2012</year> <gdppc>13600</gdppc> <neighbor name="Costa Rica" direction="W"/> <neighbor name="Colombia" direction="E">456 <b name="b"> bbb </b> </neighbor> </country> <city>789</city> </data>
關于Python 如何實現解析xml文件就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。