Pandas读取从lin开始的字符串内的unu csv EOF

2024-05-16 00:14:06 发布

男 | 程序猿一只，喜欢编程写python代码。

我正面临一个与熊猫阅读的问题。我有一个文件，其中包含“as字段值”。实际上，不应该是这样，但是我对文件生成没有影响，因此我必须找到一个解决方法。在

pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at line 15345

我在Git（link here）上找到了一个关于这个问题的报告，他们建议使用分隔符，这个分隔符也用于“sep”参数，也用于“quotechar”。在这种情况下，文件的结构会变得混乱。在

我做的另一件事是添加了一个异常，它将运行其余文件的代码，但对于特定类型的文件，我将继续存在这个问题。在

我用来读取CSV文件的命令：

df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)

有什么解决方法吗（例如，忽略这个问题的行）？我想有一种方法是使用csv库来删除这行代码（或者用其他东西代替），但是我希望它保持简单，并且在pandas中尽可能多地做。在

Python版本：3.6.2

熊猫版本：0.21.0

谢谢，并致以诚挚的问候

Tags：文件 csv 方法代码版本 pandas as error

1条回答

网友

1楼 · 发布于 2024-05-16 00:14:06

我只想指出@user8505495的建议有效（再次感谢）。在

基本上只需将参数quoting=3添加到read_csv。在to_csv中使用相同的参数会导致错误（缺少转义符）。一种选择是设置escapechar参数，或者不使用quoting参数。在