数据.xml
<?xml version="1.0" encoding="UTF-8"?>
<ArticleSet>
<Article>
<LastName>Bojarski</LastName>
<ForeName>-</ForeName>
<Affiliation>-</Affiliation>
</Article>
<Article>
<LastName>Genç</LastName>
<ForeName>Yasemin</ForeName>
<Affiliation>fgjfgnfgn</Affiliation>
</Article>
</ArticleSet>
示例代码
^{pr2}$此代码删除从属关系等于-即其从属标记看起来像<Affliation>-</Affliation>
的文章
当我将剩余的输出存储到输出.xml它将Unicode字符Genç
解析为Genç
,我想原样存储它。在
代码输出
<ArticleSet>
<Article>
<LastName>Genç</LastName>
<ForeName>Yasemin</ForeName>
<Affiliation>fgjfgnfgn</Affiliation>
</Article>
</ArticleSet>
所需输出
<ArticleSet>
<Article>
<LastName>Genç</LastName>
<ForeName>Yasemin</ForeName>
<Affiliation>fgjfgnfgn</Affiliation>
</Article>
</ArticleSet>
在
etree.write
方法中有encoding
参数。您还可以使用xml_declaration=True
来声明输出文档的编码。在见lxml documentation。在
相关问题 更多 >
编程相关推荐