python處理xml資料

由於最近需要使用python處理xml資料，因此到網上找了些資料學習了下。

最新學習的是python的xml.dom.minidom模組，按照資料上的說法，特地在python命令列環境驗證了一下：

執行之後卻發現xml.dom.minidom無法獲取xml節點之間的文字值，**如下：

>>> test = "14

">>> tdoc = xml.dom.minidom.parsestring(test)

w=tdoc.getelementsbytagname('b')

>>> node=w[0]

>>> node.nodevalue

網上的資料和python官方文件都說是用 node.nodevalue獲取節點的值，但是上述**卻輸出為空。注意到node.nodevalue只對text_node型別的節點有效，因此檢視一下節點b的型別：

>>> node.nodetype

11代表element_node節點型別。於是在網上和官方文件找了半天，也沒有獲取到什麼有用的資訊。不得以，只好看看其他的模組。在網上的另一篇文章中

對比了python處理xml的模組效能優勢，於是選擇了 celementtree 模組，測試**如下：

>>> import celementtree

>>> dir(celementtree )

['comment', 'element', 'elementpath', 'elementtree', 'pi', 'processinginstruction', 'qname', 'subelement', 'treebuilder', 'version', 'xml', 'xmlid', 'xmlparser', 'xmlparsererror', 'xmltreebuilder', '__doc__', '__file__', '__name__', '__version__', 'dump', 'fromstring', 'iselement', 'iterparse', 'parse', 'tostring']

>>> test = "1wewew

">>>

>>> dom = celementtree.parse(test)

traceback (most recent call last):

file "", line 1, in ?

file "", line 45, in parse

file "", line 22, in parse

ioerror: [errno 2] no such file or directory: "1wewew

">>> dom = celementtree.fromstring(test)

>>> root = dom.getroot()

traceback (most recent call last):

file "", line 1, in ?

attributeerror: getroot

>>> type(dom)

>>> dir(dom)

>>> dom.find('b')

>>> w=dom.find('b')

>>> w.text

'1'>>> test = "1wewew"

>>> dom = celementtree.fromstring(test)

>>> dom.find('b')

>>> w=dom.find('b')

>>> w.text

'1'>>> w=dom.find('b')

>>> w.text

'1'>>> w=dom.findall('b')

>>> type(w)

>>> w

[, ]

>>> w[1].text

'wewew'

>>> c=dom.find('c')

>>> dir(c)

>>> c.items()

[('id', '1')]

>>> c.get('id')

'1'>>>

不過， celementtree.fromstring(test)有乙個小小的陷進，當你要查詢的節點是root節點是，你無法使用dom.find(node)的方式獲取節點，而且也無法判斷當前節點是否是自己所需要的節點，乙個變通的方法：

str(dom).split(' ')[1][1:-1] == node:

可以通過判斷上述**的true和false來獲取

python處理xml資料

使用Python處理XML

python 處理xml檔案

使用Python處理XML

python處理xml資料

使用Python處理XML

python 處理xml檔案

使用Python處理XML

相關推薦