我有一个xml文件,如下所示:
<?xml version="1.0"?>
<max:SyncObject xmlns:max="http://www.ibm.com/max">
<max:ObjectSet>
<max:PARENT action="AddChange">
<max:FIELD1>string</max:FIELD1>
<max:FIELD2>string</max:FIELD2>
<max:FIELD3>string</max:FIELD3>
<max:FIELD4>string</max:FIELD4>
<max:FIELD5>string</max:FIELD5>
<max:FIELD6>string</max:FIELD6>
<max:FIELD7>string</max:FIELD7>
<max:CHILD1 action="Ignored">
<max:CH1FIELD1 action="Ignored">
<max:CH1SUB1>string</max:CH1SUB1>
<max:CH1FIELD2>string</max:CH1FIELD2>
</max:CHILD1>
<max:CHILD2 action="Ignored">
<max:CH2FIELD1>string</max:CH2FIELD1>
</max:CHILD2>
</max:PARENT>
</max:ObjectSet>
</max:SyncObject>
我想要达到的最终结果如下:
{'PARENT': ['FIELD1', 'FIELD2', 'FIELD3', 'FIELD4', 'FILED5', 'FIELD6', 'FIELD7', 'CHILD1', 'CHILD2']}, {'CHILD1': ['CH1FIELD1', 'CH1FIELD2'], 'CHILD2': ['CH2FIELD1'], 'CH1FIELD1':['CH1SUB1']}
所以我尝试了几种不同的方法来提取FIELD1
,FIELD2
。。。XML文件中的标记,同时仍然保持结构,正如您所看到的PARENT
字典与其余的字典是分开的,它只包含下面一个级别的所有标记。对于children标签也是如此。不需要action attrib,因为这将由类中的其他方法指定。你知道吗
似乎大多数lxml和elementtree都倾向于从XML标记中提取属性,而不是标记本身。你知道吗
有没有人能告诉我在提取标签(字段名)时没有前缀、值或任何属性的正确方向,并保留结构?你知道吗
谢谢!你知道吗
首先,XML数据的格式不好,缺少一个结束语
</max:CH1FIELD1>
。你知道吗要将其转换为python数据结构,请使用^{} :
相关问题 更多 >
编程相关推荐