LXML:获取标题/顶层命令

2024-05-18 23:26:53 发布

您现在位置:Python中文网/ 问答频道 /正文

最好使用LXML库,有没有一种方法可以在解析完XML结构之后访问它的顶部的注释。我想避免解析纯文本“我自己”。你知道吗

这个例子让我对它的兴趣显而易见,我想:)

<?xml version="1.0"?>
<!DOCTYPE pathway SYSTEM "https://www.kegg.jp/kegg/xml/KGML_v0.7.2_.dtd">
<!-- Creation date: Jan 11, 2019 11:48:16 +0900 (GMT+9) -->

所以我希望有一个函数可以返回最后一行的注释。 当然,对于如何处理好这个问题,我也很高兴有其他的想法。你知道吗


Tags: 方法https文本versionwwwxml结构system
1条回答
网友
1楼 · 发布于 2024-05-18 23:26:53

可以使用XPathcomment()获取注释节点。更具体地说,您可以通过使用/comment()[1]查询仅获取文档节点中的第一条注释。下面是一个独立的示例:

>>> raw = '''<?xml version="1.0"?>
... <!DOCTYPE pathway SYSTEM "https://www.kegg.jp/kegg/xml/KGML_v0.7.2_.dtd">
... <!  Creation date: Jan 11, 2019 11:48:16 +0900 (GMT+9)  >
... <root>
... <child>content</child>
... <!  Comment 2  >
... </root>
... <!  Comment 3  >'''
>>> from lxml import etree as et
>>> root = et.fromstring(raw)
>>> first_comment = root.xpath("/comment()[1]")
>>> print(first_comment)
[<!  Creation date: Jan 11, 2019 11:48:16 +0900 (GMT+9)  >]

相关问题 更多 >

    热门问题