我有一个名为“data.csv”的文件:
1997,Ford,E350
1997, Ford , E350
1997,Ford,E350,"Super, luxurious truck"
1997,Ford,E350,"Super ""luxurious"" truck"
1997,Ford,E350," Super luxurious truck "
"1997",Ford,E350
1997,Ford,E350
2000,Mercury,Cougar
我想把它解析成pandas数据框,这样数据框看起来如下:
Year Make Model Description
0 1997 Ford E350 None
1 1997 Ford E350 None
2 1997 Ford E350 Super, luxurious truck
3 1997 Ford E350 Super "luxurious" truck
4 1997 Ford E350 Super luxurious truck
5 1997 Ford E350 None
6 1997 Ford E350 None
7 2000 Mercury Cougar None
我能做的就是:
pd.read_table("data.csv", sep=r',', names=["Year", "Make", "Model", "Description"])
这让我明白了:
Year Make Model Description
0 1997 Ford E350 None
1 1997 Ford E350 None
2 1997 Ford E350 Super, luxurious truck
3 1997 Ford E350 Super "luxurious" truck
4 1997 Ford E350 Super luxurious truck
5 1997 Ford E350 None
6 1997 Ford E350 None
7 2000 Mercury Cougar None
如果没有这些空白,如何获取数据帧?
把参数} 对我有效。
skipinitialspace=True
添加到^{所以试试看:
同样的事情也适用于
pd.read_csv()
。您可以使用转换器:
收益率
好吧,空白在数据中,所以不读入空白就不能读入数据。但是,在读入之后,您可以通过执行
df["Make"] = df["Make"].map(str.strip)
(其中df
是您的数据帧)来去掉空白。相关问题 更多 >
编程相关推荐