熊猫.错误.解析器错误: 错误可能是由于使用多个字符分隔符时忽略引号引起的

2024-04-27 11:52:53 发布

您现在位置:Python中文网/ 问答频道 /正文

当我试图使用Pandas读取csv文件时,出现了一个解析器错误。下面给出了错误和引发此错误的数据集。

pandas.errors.ParserError: Expected 10 fields in line 8, saw 11. Error could possibly be due to quotes being ignored when a multi-char delimiter is used.

下面是出现此错误的第8行

10/29/18 10:20,85505306,    Scott,20181029102023-file.csv,  22.49,-12.18,CITY,,12:15.0,51:00.0,ABCD,9898,320,D231

我正在使用以下命令读取csv:

df.to_csv('file.csv'), index = False)

csv文件的示例输出:

File_Received_Time  Label1  City    FileName    Label2  Label3  State   Unnamed: 12 cTimestamp  dTimestamp  Label4  Label5  Label6  Label7  Label8
10/29/18 10:20  56776   Paris   file1.csv   29  29  IL      29-10-2018 04:11:11     COL06   620 398 516 451
10/29/18 10:20  46069   Hongkong    file2.csv   61  58  VA      29-10-2018 04:03:17 28-10-2018 05:58:00 COL06   576 645 349 374
10/29/18 10:20  47240   Sydney  file3.csv   43  42  IL      29-10-2018 04:12:46     COL06   534 2047    56831   372
10/29/18 10:20  47432   NewYork file4.csv   55  61  OH          28-10-2018 09:01:00 COL06   514 2354    640 633
10/29/18 10:20  41794   London  file5.csv   39  29          29-10-2018 04:12:46 28-10-2018 09:01:00 COL06   470 2354    56831   550
10/29/18 10:20  49643   LA  file6.csv   55  43  TX      29-10-2018 04:05:18     COL06   523 2301    53942   403
10/29/18 10:20  54700   Shangai file7.csv   37  29  AZ      29-10-2018 04:12:15 28-10-2018 12:51:00 COL06   569 2683    53642   538
10/29/18 10:20  37134   Singapore   file8.csv   53  62  AZ      29-10-2018 04:09:16     COL06   560 391 54541   542
10/29/18 10:20  51144   Taiwan  file9.csv   43  33  TX      29-10-2018 04:12:15     COL06   469 472 458 481

Tags: 文件csvto数据解析器pandas错误il
2条回答

我收到了同样的错误信息。我已经从文件中删除了双引号,这就解决了问题。我在终端中使用了以下行:

cat merged.csv | tr“”o”>;合并.tsv

希望有帮助。

我可以阅读您粘贴在上面的错误记录:

要通过pandas读取csv,请使用read_csv

我在csv中粘贴了错误记录:

mayankp@mayank:~/Documents cat t1.csv 
10/29/18 10:20,85505306,    Scott,20181029102023-file.csv,  22.49,-12.18,CITY,,12:15.0,51:00.0,ABCD,9898,320,D231

现在,我在《熊猫》里读到如下:

In [114]: df = pd.read_csv('/home/mayankp/Documents/t1.csv', header=None)

In [115]: df
Out[115]: 
               0         1          2                        3      4      5     6   7        8        9     10    11   12    13
0  10/29/18 10:20  85505306      Scott  20181029102023-file.csv  22.49 -12.18  CITY NaN  12:15.0  51:00.0  ABCD  9898  320  D231

它工作得很好。如果有帮助,请告诉我。

相关问题 更多 >