ElementTree分析错误,因为撇号“'”(无XML声明)

2024-06-06 05:01:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用ElementTree查看MySQL记录并解析出存储在没有任何声明的XML。我知道文本编码有问题,但我不确定如何解决这个问题。我得到的错误是:

xml.parsers.expat.ExpatError: not well-formed (invalid token): 

我尝试过s.decode(“CP1252”).encode(“UTF-8”)和一个简单的s.replace(“”,“”),但都没有帮助(s是XML的记录)。我还打印了这些转换前后的字符串,结果发现打印时,字符显示为“?”,在转换之前和之后。我原以为它会在替换后消失(“'”,“”),但它没有。在

有什么想法吗?在

谢谢!在

' 编辑:

我正在用一个字符串来复制这个问题,而不是用MySqlDb,但它没有产生错误。默认情况下,MySQLDb不是UTF-8编码的,因此必须在DB连接中指定。一旦我添加了'init_命令。。。utf8'在连接结束时,它能够解释撇号并将其包含在查询的REPLACE(column_with_xml,'”,“”)部分。在

^{pr2}$

Tags: 字符串文本声明编码错误记录mysqlnot