我想从使用Beautifulsoup从url解析的字符串中删除井号。我得到了如下的磅符号错误。 SyntaxError:文件中的非ASCII字符“\xa3”
我试图把这个# -*- coding: utf-8 -*-
放在类的开头,但是仍然得到了错误。在
这是密码。在我得到浮点数之后,我想把它写成csv文件。在
mainTag = SoupStrainer('table', {'class':'item'})
soup = BeautifulSoup(resp,parseOnlyThese=mainTag)
tag= soup.findAll('td')[3]
price = tag.text.strip()
pr = float(price.lstrip(u'£').replace(',', ''))
问题很可能是编码问题,以及字节与字符的关系。CSV文件是用什么编码创建的?文件中出现英镑符号的字节序列是什么?变量
price
中包含哪些字节?您需要替换字符串中实际出现的字节。其中一个难题是源代码中数据的内容。这就是源代码顶部的# -*- coding: utf-8 -*-
标记的意义所在:它告诉python如何解释字符串文本中的字节。在替换字符之前,您可能需要(或希望)解码CSV文件中的字节,以创建Unicode字符串。在我要指出的是,documentation for the csv module in Python 2.7表示:
示例部分包括以下代码,演示如何将csv模块提供的字节解码为Unicode字符串。在
相关问题 更多 >
编程相关推荐