如何修复使用read_csv方法读取csv数据时出现的错误?

2024-05-23 21:14:13 发布

您现在位置:Python中文网/ 问答频道 /正文

从以下位置下载的数据:https://www.kaggle.com/c/titanic/data

为了确保代码的可复制性,我尝试执行以下操作,但它会给我一个解析错误

train = pd.read_csv("https://www.kaggle.com/c/titanic/download/GQf0y8ebHO0C4JXscPPp%2Fversions%2FXkNkvXwqPPVG0Qt3MtQT%2Ffiles%2Ftrain.csv")

获取此错误

ParserError: Error tokenizing data. C error: Expected 1 fields in line 6, saw 2

以下是文件的前3行:

PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38,1,0,PC 17599,71.2833,C85,C

我认为这是因为"Name"列有逗号分隔名字和姓氏 我尝试在pd.read_csv中添加作为分隔符,但它不起作用。 有什么建议吗? 多谢各位


Tags: csv数据代码namehttpscomreaddata