我环顾了四周,只找到了Python2.6和更早版本的解决方案,但在Python3.X中没有关于如何做到这一点的任何内容(我只能访问Win7 box)
我必须能够在3.1中做到这一点,最好没有外部库。目前,我已经安装了httplib2并可以访问命令提示符curl(这就是我获取页面源代码的方式)。不幸的是,curl没有解码html实体,据我所知,我在文档中找不到解码它的命令。
是的,我试过让漂亮的汤工作,很多次在3.X中都没有成功。如果你能提供如何在微软Windows环境下让它在python 3中工作的明确说明,我将非常感激。
所以,为了清楚起见,我需要把这样的字符串:Suzy & John
变成这样的字符串:“Suzy&John”。
您可以使用函数html.unescape:
在Python3.4+中(感谢J.F.Sebastian的更新):
在Python3.3或更早的时候:
在Python2中:
您可以为此目的使用^{} 。该模块包含在Python标准库中,可在Python 2.x和Python 3.x之间移植
显然,我没有足够高的声誉做任何事,除了张贴这个。联合国大学的答复并没有改变引文。我唯一发现的就是这个功能:
我从这里得到的。
相关问题 更多 >
编程相关推荐