我有一个与python(IPython笔记本)中的编码问题有关的问题。因为这类问题很常见也很简单,但我还是不能真正解决。
我这里有一个CSV文件,正如您所看到的,这个文件中有许多'\xa0'和其他'\n'字符。
我用过
with io.open(train_fname) as f:
for line in f:
line = line.encode("ascii", "replace")
但它不工作,我总是得到以下输出。
Imagine being able say, you know what, no sanctions, no forever hearings on IEAA regulations, no more hiding\xa0under\xa0the pretense of friendly nuclear energy. \xa0You have 2 days to; \xa0i.e. \xa0let in the inspectors, quit killing the civilians.
我试过其他方法,比如
line.replace(u"\xa0", " ")
它也不工作,我也尝试了各种编码打开这个CSV文件在我的文本编辑,升华文本。
我尝试了windows-1252、utf-8和所有其他编码,但每次查看此CSV文件时,都会得到“xa0是我的文本编辑”。
这是不是意味着
\xa0
是否已作为输入文本写入此CSV文件?这不是python编码的问题吗?如果是这种情况,为什么不能使用replace方法简单地替换这个字符串?\xa0表示文件正在编码哪个编码?这意味着这个文件是用utf-8写的,但我试图用ascii或其他方式打开它?
我搜了很多问题,但似乎没有多少帮助。如果我的问题不太清楚,请问我。 非常感谢你!
`
目前没有回答
相关问题 更多 >
编程相关推荐