使用minidom从节点列表中删除第一个和最后一个节点

file='C:/My_Folders/something.xml' doc=parse(file) paras=doc.getElementsByTagName('para') def getText(paras): rc = [] for node in paras: if node.nodeType == node.TEXT_NODE: rc.append(node.data) else: rc.append(getText(node.childNodes)) return ','.join(rc) print(getText(paras))

<para ><reviewer-note >tlewis</reviewer-note ></para> <para><user-typing>Resilient.</para> <para>hashing.</para> <para>"X" release.</para> <para>[See <url href="http://www.google.com" >Trunk/ECMP Groups</url>.]</para>

1条回答

网友

1楼 · 发布于 2024-06-02 08:01:33

可以使用BeautifulSoup解析XML。在我的示例中，我使用select()方法选择了所有<para>标记，然后将它们连接在一起（没有第一个和最后一个）：

data = """<para
><reviewer-note >tlewis</reviewer-note
></para>
<para><user-typing>Resilient.</para>
<para>hashing.</para>
<para>"X" release.</para>
<para>[See <url
href="http://www.google.com"
>Trunk/ECMP Groups</url>.]</para>"""

from bs4 import BeautifulSoup

soup = BeautifulSoup(data, 'lxml')

all_params = soup.select('para')[1:-1]

string_output = ''
for param in all_params:
    string_output += param.text.strip() + ','
string_output = string_output.rstrip(',')

print(string_output)

输出：

Resilient.,hashing.,"X" release.

相关问题更多 >

编程相关推荐

热门问题

热门文章