我在学大熊猫Python。 我看到了一个教程,其中显示了保存pandas数据框的两种方法。
pd.to_csv('sub.csv')
并打开pd.read_csv('sub.csv')
pd.to_pickle('sub.pkl')
并打开pd.read_pickle('sub.pkl')
教程说to_pickle
是将数据帧保存到磁盘。我对此感到困惑。因为当我使用to_csv
时,我确实看到一个csv文件出现在文件夹中,我假设它也保存在磁盘上对吗?
一般来说,为什么我们希望使用to_pickle
保存数据帧,而不是将其保存为csv、txt或其他格式?
Pickle是存储Pandas数据帧的序列化方法。你基本上是把数据帧的精确表示写下来。这意味着列的类型相同,索引相同。如果您只是将文件保存为csv,那么您只是将其存储为逗号分隔的列表。根据您的数据集,当您加载备份时,某些信息将丢失。
https://docs.python.org/3/library/pickle.html
相关问题 更多 >
编程相关推荐