保留XML标记Python DOM实现

2024-05-16 06:26:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我刚浏览完python DOM API,似乎找不到我要找的东西。在

我基本上希望在遍历DOM树时保留XML标记。我的想法是打印标记名和相应的属性,稍后我要将它们转换为xml文件。在

<book name="bookname" source="/home/phiri/Book/book.xml"
      xmlns:xi="http://www.w3.org/2001/XInclude">
  <chapter>
    <page>page1</page>
    <page>page2</page>
  </chapter>
  <chapter>
    <page>page1</page>
    <page>page2</page>
    <page>Page3</page>
  </chapter>
</book>

例如,使用上面的XML内容,我想要的是图书.xml要保存的文件。在

^{pr2}$

在使用python提取内容时,有没有其他xml包可以用来保存我得到的结果?在


Tags: 文件name标记api内容属性pagexml
1条回答
网友
1楼 · 发布于 2024-05-16 06:26:30

从输入获取您发布的输出的一个简单方法是重写XSLT identity transform。看起来您希望消除所有文本节点和具有两个以上祖先的所有元素,因此只需为这些节点添加空模板:

<xsl:template match="text()"/>

<xsl:template match="*[count(ancestor::*) &gt; 2]"/>

通常,在Python中使用XSLT的最佳方法是使用libxml2模块。除非您需要纯Python解决方案,在这种情况下,您无法使用XSLT,因为还没有人构建纯Python XSLT处理器。在

相关问题 更多 >