如何强制BeautifulGroup输出Htmlenties

2024-04-19 04:48:56 发布

您现在位置:Python中文网/ 问答频道 /正文

beauthulsoup可以在解析文档时轻松地转换html实体。在

但是,有没有一种方法可以在将其转换为字符串时反转此步骤,以便再次获得可解析的输出?在

我得到的是:

>>> import BeautifulSoup
>>> BeautifulSoup.BeautifulSoup("<p>a&lt;b</p>", convertEntities=BeautifulSoup.BeautifulSoup.ALL_ENTITIES)
<p>a<b</p>

以下是我想要的:<p>a&lt;b</p>


Tags: 方法字符串文档importlt实体html步骤
1条回答
网友
1楼 · 发布于 2024-04-19 04:48:56

由于我找不到任何API解决方案,所以我使用这个monkey补丁来实现预期的结果:

from BeautifulSoup import NavigableString
__nv_str__str__ = NavigableString.__str__
NavigableString.__str__ = lambda self, encoding=None: __nv_str__str__(self, encoding=encoding).replace("<", "&lt;").replace(">", "&gt;")

相关问题 更多 >