将pandas数据帧保存到pickle和保存到csv之间有什么区别?

2024-06-11 07:06:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我在学大熊猫Python。 我看到了一个教程,其中显示了保存pandas数据框的两种方法。

  1. pd.to_csv('sub.csv')并打开pd.read_csv('sub.csv')

  2. pd.to_pickle('sub.pkl')并打开pd.read_pickle('sub.pkl')

教程说to_pickle是将数据帧保存到磁盘。我对此感到困惑。因为当我使用to_csv时,我确实看到一个csv文件出现在文件夹中,我假设它也保存在磁盘上对吗?

一般来说,为什么我们希望使用to_pickle保存数据帧,而不是将其保存为csv、txt或其他格式?


Tags: 文件csvto数据方法txt文件夹pandas
1条回答
网友
1楼 · 发布于 2024-06-11 07:06:11

Pickle是存储Pandas数据帧的序列化方法。你基本上是把数据帧的精确表示写下来。这意味着列的类型相同,索引相同。如果您只是将文件保存为csv,那么您只是将其存储为逗号分隔的列表。根据您的数据集,当您加载备份时,某些信息将丢失。

https://docs.python.org/3/library/pickle.html

相关问题 更多 >