Pandas读取从lin开始的字符串内的unu csv EOF

2024-04-16 17:45:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我正面临一个与熊猫阅读的问题。我有一个文件,其中包含“as字段值”。实际上,不应该是这样,但是我对文件生成没有影响,因此我必须找到一个解决方法。在

pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at line 15345

我在Git(link here)上找到了一个关于这个问题的报告,他们建议使用分隔符,这个分隔符也用于“sep”参数,也用于“quotechar”。在这种情况下,文件的结构会变得混乱。在

我做的另一件事是添加了一个异常,它将运行其余文件的代码,但对于特定类型的文件,我将继续存在这个问题。在

我用来读取CSV文件的命令:

df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)

有什么解决方法吗(例如,忽略这个问题的行)?我想有一种方法是使用csv库来删除这行代码(或者用其他东西代替),但是我希望它保持简单,并且在pandas中尽可能多地做。在

Python版本:3.6.2

熊猫版本:0.21.0

谢谢,并致以诚挚的问候


Tags: 文件csv方法代码版本pandasaserror
1条回答
网友
1楼 · 发布于 2024-04-16 17:45:45

我只想指出@user8505495的建议有效(再次感谢)。在

基本上只需将参数quoting=3添加到read_csv。在to_csv中使用相同的参数会导致错误(缺少转义符)。一种选择是设置escapechar参数,或者不使用quoting参数。在

相关问题 更多 >