我正面临一个与熊猫阅读的问题。我有一个文件,其中包含“as字段值”。实际上,不应该是这样,但是我对文件生成没有影响,因此我必须找到一个解决方法。在
pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at line 15345
我在Git(link here)上找到了一个关于这个问题的报告,他们建议使用分隔符,这个分隔符也用于“sep”参数,也用于“quotechar”。在这种情况下,文件的结构会变得混乱。在
我做的另一件事是添加了一个异常,它将运行其余文件的代码,但对于特定类型的文件,我将继续存在这个问题。在
我用来读取CSV文件的命令:
df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)
有什么解决方法吗(例如,忽略这个问题的行)?我想有一种方法是使用csv库来删除这行代码(或者用其他东西代替),但是我希望它保持简单,并且在pandas中尽可能多地做。在
Python版本:3.6.2
熊猫版本:0.21.0
谢谢,并致以诚挚的问候
我只想指出@user8505495的建议有效(再次感谢)。在
基本上只需将参数
quoting=3
添加到read_csv
。在to_csv
中使用相同的参数会导致错误(缺少转义符)。一种选择是设置escapechar
参数,或者不使用quoting
参数。在相关问题 更多 >
编程相关推荐