我正在尝试编写一些代码,这些代码将在XML文章文件中搜索标记中包含的特定DOI。当它找到正确的DOI后,我希望它访问与该DOI相关的文章的<title>
和{
我的XML文件格式如下:
<root>
<article>
<number>
0
</number>
<DOI>
10.1016/B978-0-12-381015-1.00004-6
</DOI>
<title>
The patagonian toothfish biology, ecology and fishery.
</title>
<abstract>
lots of abstract text
</abstract>
</article>
<article>
...All the article tags as shown above...
</article>
</root>
我希望脚本找到doi10.1016/B978-0-12-381015-1.00004-6的文章(例如),然后让我能够访问相应的<title>
和{<article>
。在
{我一直在努力调整代码:
^{pr2}$但我不太清楚我在做什么!在
谢谢你的帮助。在
迷你身份是必要条件吗?用lxml和XPath解析它会非常容易。在
这将得到指定DOI的文章。在
另外,标记之间似乎有空格。我不知道这是否是因为Stackoverflow格式。这可能就是为什么你不能将它与minidom相匹配。在
imho-只要在python文档中查找就行了! 试试这个(未测试):
相关问题 更多 >
编程相关推荐