Python:在CSV中得到了\xa0而不是空格,不能删除或继续

2024-05-19 02:49:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个与python(IPython笔记本)中的编码问题有关的问题。因为这类问题很常见也很简单,但我还是不能真正解决。

我这里有一个CSV文件,正如您所看到的,这个文件中有许多'\xa0'和其他'\n'字符。

我用过

with io.open(train_fname) as f:
for line in f:
    line = line.encode("ascii", "replace")

但它不工作,我总是得到以下输出。

Imagine being able say, you know what, no sanctions, no forever hearings on IEAA regulations, no more hiding\xa0under\xa0the pretense of friendly nuclear energy. \xa0You have 2 days to; \xa0i.e. \xa0let in the inspectors, quit killing the civilians.

我试过其他方法,比如

line.replace(u"\xa0", " ") 它也不工作,我也尝试了各种编码打开这个CSV文件在我的文本编辑,升华文本。 我尝试了windows-1252、utf-8和所有其他编码,但每次查看此CSV文件时,都会得到“xa0是我的文本编辑”。

这是不是意味着

\xa0

是否已作为输入文本写入此CSV文件?这不是python编码的问题吗?如果是这种情况,为什么不能使用replace方法简单地替换这个字符串?\xa0表示文件正在编码哪个编码?这意味着这个文件是用utf-8写的,但我试图用ascii或其他方式打开它?

我搜了很多问题,但似乎没有多少帮助。如果我的问题不太清楚,请问我。 非常感谢你!

`


Tags: 文件csvthe方法noin文本编码

热门问题