pandas以'''和''作为cs中的值导入csv

2024-05-16 17:50:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个csv,它有这样一个条目:

"432983278.2","3764",""The CITY TOW" of San Francisco, CA","",""...

也就是说,在一个条目中有一个逗号和几个引号,应该作为"THE CITY TOW" of San Francisco, CA来选取 我没有重新生成此csv的选项

我尝试了pandas.read_csv("thefile.csv",quoting=csv.QUOTE_ALL, quotechar = '"')和一些不同的编码和引用选项,但仍然无法处理。你知道吗


Tags: ofcsvthecitypandasread选项条目
3条回答

你可以试试这个

import pandas as pd

df = pd.read_csv(file_path, 
                 sep=', (?=(?:"[^"]*?(?: [^"]*)*))|, (?=[^",]+(?:,|$))',
                 engine='python')

如果只有几行,你能忽略这些行吗?你知道吗

import pandas as pd
pd.read_csv("thefile.csv", error_bad_lines=False)

问题是不需要的双引号。但是,如果您查看该模式,(",")似乎是一个分隔符,它可以为您提供所需的内容。你知道吗

由于数据的所有列都是字符串,因此可以使用dtype=strsep='","'将csv导入数据帧

"432983278.2","3764",""The CITY TOW" of San Francisco, CA","",""...

尝试使用:

df = pd.read_csv('file.csv', sep='","', dtype=str)

相关问题 更多 >