Python minidom解析器中的标签不匹配错误
我正在使用Python的minidom
来解析一个文档,比如:
<root>
<foo>This tag contains a "<bar>" string</foo>
</root>
这个"<bar>"
字符串导致了一个错误,叫做xml.parsers.expat.ExpatError: mismatched tag
。
有没有办法解决这个问题,而不需要修改输入文件呢?
1 个回答
1
你提到的“黑客输入文件”,其实是指“让我的HTML符合规范”。在“<bar>”这个例子中,开头的“<”应该用HTML编码成“<”。否则,解析器怎么知道这真的不是一个HTML标签呢?