这是我的密码:
with open(path) as file:
lines = file.readlines()
print lines[0:5]
但是我有很多额外的字符,例如:
['cat2\xc2\xa0\xc2\xa0 2\xc2\xa0 0', 'cat1\xc2\xa00.5\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 1\xc2\xa0 0', 'cat1\xc2\xa0\xc2\xa0 0\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 0\xc2\xa0 3']
我为什么要得到它们?你知道吗
原始文本文件如下:
cat2 2 0
cat1 0.5 0
cat2 1 0
cat1 0 0
cat2 0 3
\xc2\xa0
是non-breaking space
。将其替换为文件中的常规空格。你知道吗这个序列出现在许多编码中,包括
UTF-8
。你知道吗有关Wikipedia的详细信息
相关问题 更多 >
编程相关推荐