我试图从一个网站解析锚文本(示例:梅赛德斯-奔驰,308,savivarčiai)。在
使用:python3.4
<h2 class="title-list"><a href="http://auto.plius.lt/skelbimai/mercedes-benz-308-savivarciai-3876306.html" title="Mercedes-Benz, 308, savivarčiai" onclick="OpenNamedPopup('http://auto.plius.lt/skelbimai/mercedes-benz-308-savivarciai-3876306.html', 'A3876306'); return false;">Mercedes-Benz, 308, savivarčiai</a> </h2>
我的代码如下:
^{pr2}$但我得到的返回是一堆行,其中有none none none。。在
我的第二个问题是关于编码的问题,当我试图打印一些东西时,我遇到了编码问题
像这样:
UnicodeEncodeError: 'charmap' codec can't encode character '\x8d' in position 248: character maps to <undefined>
我怎么解决这个问题?
r.编码的输出:
ISO-8859-1
问题已解决
我安装了PyCharm,它在PyCharm控制台上工作。问题是我的windows终端没有显示拉丁字符。在
让
requests.content
处理编码并从a
标记中获取文本:相关问题 更多 >
编程相关推荐