Pandas - pandas.DataFrame.from_csv与pandas.read_csv的比较

29 投票
2 回答
22027 浏览
提问于 2025-04-28 21:20

这两个东西有什么区别呢:

pandas.DataFrame.from_csv,文档链接:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.from_csv.html

pandas.read_csv,文档链接:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html

暂无标签

2 个回答

3

另一个区别是,pandas.read_csv 的速度比 pandas.DataFrame.from_csv 快了46到490倍(这是我测试的结果)。

我是在Windows系统上,用Python 3.4.4和pandas 0.19.2对我自己的csv文件进行测试的。

33

这两者之间其实没有什么实质性的区别(它们都是基于同样的基本功能),不过正如评论中提到的,它们有一些默认值不同(比如index_col的默认值是0或者None,而read_csvDataFrame.from_csvparse_dates上的默认值分别是True和False),而且read_csv支持更多的参数(在from_csv中,这些参数只是没有被传递而已)。

除此之外,推荐使用pd.read_csv
DataFrame.from_csv只是为了历史原因而存在,以保持向后兼容性(计划将其弃用,具体可以查看这里),而所有的新功能只会添加到read_csv中(你可以在更长的参数列表中看到这一点)。实际上,这一点在文档中应该更清楚一些。

撰写回答