Pandas - pandas.DataFrame.from_csv与pandas.read_csv的比较
这两个东西有什么区别呢:
pandas.DataFrame.from_csv
,文档链接:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.from_csv.html
和
pandas.read_csv
,文档链接:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html
2 个回答
3
另一个区别是,pandas.read_csv
的速度比 pandas.DataFrame.from_csv
快了46到490倍(这是我测试的结果)。
我是在Windows系统上,用Python 3.4.4和pandas 0.19.2对我自己的csv文件进行测试的。
33
这两者之间其实没有什么实质性的区别(它们都是基于同样的基本功能),不过正如评论中提到的,它们有一些默认值不同(比如index_col
的默认值是0或者None,而read_csv
和DataFrame.from_csv
在parse_dates
上的默认值分别是True和False),而且read_csv
支持更多的参数(在from_csv
中,这些参数只是没有被传递而已)。
除此之外,推荐使用pd.read_csv
。
DataFrame.from_csv
只是为了历史原因而存在,以保持向后兼容性(计划将其弃用,具体可以查看这里),而所有的新功能只会添加到read_csv
中(你可以在更长的参数列表中看到这一点)。实际上,这一点在文档中应该更清楚一些。