从以下位置下载的数据:https://www.kaggle.com/c/titanic/data
为了确保代码的可复制性,我尝试执行以下操作,但它会给我一个解析错误
train = pd.read_csv("https://www.kaggle.com/c/titanic/download/GQf0y8ebHO0C4JXscPPp%2Fversions%2FXkNkvXwqPPVG0Qt3MtQT%2Ffiles%2Ftrain.csv")
获取此错误
ParserError: Error tokenizing data. C error: Expected 1 fields in line 6, saw 2
以下是文件的前3行:
PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38,1,0,PC 17599,71.2833,C85,C
我认为这是因为"Name"
列有逗号分隔名字和姓氏
我尝试在pd.read_csv
中添加“作为分隔符,但它不起作用。
有什么建议吗?
多谢各位
目前没有回答
相关问题 更多 >
编程相关推荐