Python版本2.7:XML元素树：如何遍历子元素的某些元素以找到匹配项

<?xml version = "1.0" encoding = "utf-8"?> <Patients> <Patient> <PatientCharacteristics> <patientCode>3</patientCode> </PatientCharacteristics> <Visits> <Visit> <DAS> <CRP>14</CRP> <ESR/> <Joints> <DAS_PROFILE>28/28</DAS_PROFILE> <SWOL28>20</SWOL28> <TEN28>20</TEN28> </Joints> </DAS> <VisitDate>2010-02-17</VisitDate> </Visit> <Visit> <DAS> <CRP>10</CRP> <ESR/> <Joints> <DAS_PROFILE>28/28</DAS_PROFILE> <SWOL28>15</SWOL28> <TEN28>20</TEN28> </Joints> </DAS> <VisitDate>2010-02-10</VisitDate> </Visit> </Visits> </Patient> <Patient> <PatientCharacteristics> <patientCode>3</patientCode> </PatientCharacteristics> <Visits> <Visit> <DAS> <CRP>14</CRP> <ESR/> <Joints> <DAS_PROFILE>28/28</DAS_PROFILE> <SWOL28>34</SWOL28> <TEN28>0</TEN28> </Joints> </DAS> <VisitDate>2010-08-17</VisitDate> </Visit> <Visit> <DAS> <CRP>10</CRP> <ESR/> <Joints> <DAS_PROFILE>28/28</DAS_PROFILE> <SWOL28></SWOL28> <TEN28>2</TEN28> </Joints> </DAS> <VisitDate>2010-07-10</VisitDate> </Visit> <Visit> <DAS> <CRP>9</CRP> <ESR/> <Joints> <DAS_PROFILE>28/28</DAS_PROFILE> <SWOL28>56</SWOL28> <TEN28>6</TEN28> </Joints> </DAS> <VisitDate>2009-07-10</VisitDate> </Visit> </Visits> </Patient> </Patients>

import xml.etree.ElementTree as ET tree = ET.parse('DB3.xml') root = tree.getroot() for child in root: # THIS GETS ME ALL THE PATIENT ATTRIBUTES print child.tag for x in child/Visit: # THIS IS WHAT I CANNOT FIND THE CORRECT SYNTAX FOR # I WOULD THEN PERFORM STEPS 6, 7 AND 8 HERE

import xml.etree.ElementTree as ET tree = ET.parse('Untitled.xml') root = tree.getroot() for child in root: print child.tag child.find( "visits" ) for x in child.iter("visit"): print x.tag, x.text

3条回答

网友

1楼 · 编辑于 2024-05-15 00:39:32

您可以直接在元素“element”下遍历所有“visit”标记，如下所示：

for x in element.iter("visit"):

您可以找到元素的第一个直接子元素，它与特定的标记匹配：

element.find( "visits" )

看起来您必须首先找到“visits”元素，它是“visit”的父元素，然后遍历其“visit”子元素。把这些放在一起你会得到这样的东西：

for patient_element in root:
    print patient_element.tag 
    visits_element = patient_element.find( "visits" )
    for visit_element in visits_element.iter("visit"):
        print visit_element.tag, visit_element.text
        # ... further processing of each visit element here

一般来说，查看xml.etree.ElementTree文档中的“查找感兴趣的元素”部分：http://docs.python.org/2/library/xml.etree.elementtree.html#finding-interesting-elements

网友

2楼 · 编辑于 2024-05-15 00:39:32

可以使用CssSelector从Patient元素获取所需的节点：

from lxml.cssselect import CSSSelector
visitSelector = CSSSelector('Visit')
visits =  visitSelector(child)

您也可以这样做，以获得patientCode标签和SWOL28标签然后可以使用element.text访问和修改元素的文本

网友

3楼 · 编辑于 2024-05-15 00:39:32

这是未经测试的应该是相当接近你想要的。

for patient in root:
    patient_code =  patient.find('PatientCharacteristics').find('patientCode')
    if patient_code.text == code:
            for visit in patient.find('Visits'):
                    visit_date = visit.find('VisitDate')
                    if visit_date.text == date:
                        swol28 = visit.find('DAS').find('Joints').find('SWOL28')
                        if swol28.text:
                            visit.find('DAS').find('Joints').set('SWOL28', new_swol28)

相关问题更多 >

编程相关推荐

热门问题

热门文章