Python minidom解析器中的标签不匹配错误

1 投票
1 回答
4186 浏览
提问于 2025-04-17 20:24

我正在使用Python的minidom来解析一个文档,比如:

<root>
  <foo>This tag contains a "<bar>" string</foo>
</root>

这个"<bar>"字符串导致了一个错误,叫做xml.parsers.expat.ExpatError: mismatched tag

有没有办法解决这个问题,而不需要修改输入文件呢?

1 个回答

1

你提到的“黑客输入文件”,其实是指“让我的HTML符合规范”。在“<bar>”这个例子中,开头的“<”应该用HTML编码成“&lt;”。否则,解析器怎么知道这真的不是一个HTML标签呢?

撰写回答