用python中的elementtree处理xml文件中的不规则字符

2条回答

网友

1楼 · 编辑于 2024-06-06 04:43:10

因为xml.parsers.expat.ParserCreate只支持四种编码，所以我会全部尝试。这些编码是： UTF-8、UTF-16、ISO-8859-1（Latin1）和ASCII。

现在可以使用如下编码运行ElementTree.parse：

from xml.etree.ElementTree import ElementTree
from xml.parsers import expat
tree = ElementTree()
root = tree.parse(xml_file, parser=expat.ParserCreate('UTF-8') )
root = tree.parse(xml_file, parser=expat.ParserCreate('UTF-16') )
root = tree.parse(xml_file, parser=expat.ParserCreate('ISO-8859-1') )
root = tree.parse(xml_file, parser=expat.ParserCreate('ASCII') )

网友

2楼 · 编辑于 2024-06-06 04:43:10

你需要确定两件事。

（a）是否有XML声明，它对编码有何说明？

（b）文件中用于表示这些字符的实际字节是多少？

编程相关推荐

java hibernate。MappingException持久类未知
其余的都是java。lang.ClassNotFoundException:雅加达。servlet。在Tomcat 9上运行时在Maven/Jersey web服务上进行筛选
java从异步任务返回结果
java阶乘程序打印出递归
停止或重新部署Spring 3.1.2、Hibernate 4.1.0、Spring DataJpa 1.1.0、Tomcat 7.0.30时出现java内存泄漏
java如何在配置文件中生成计算属性
集合java 8将ListB的所有元素合并到ListA中（如果不存在）
运行mvn verify时，java为'test'配置文件中的测试设置defaultbinder
java如何在Hashmap中删除重复的键值对？不只是复制键或值
java如何编程一个按钮以成功加载数组中的下一个数据

相关问题更多 >

编程相关推荐

热门问题

热门文章

用python中的elementtree处理xml文件中的不规则字符

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >