2024-06-02 05:42:15 发布
网友
该文件大约2GB,有大约100万条记录,有200多列。我整晚都在尝试使用pd.read_csv()创建数据帧,但内核冻结,无法完成数据帧的创建
pd.read_csv()
我应该如何加载大量的数据集
您可以使用“Pandas”,因为它将数据集保存在RAM中,因此可以更快地执行特定计算(尝试创建数据帧以管理数据)。您还可以使用“Dask”执行分布式和并行计算
您可以使用“Pandas”,因为它将数据集保存在RAM中,因此可以更快地执行特定计算(尝试创建数据帧以管理数据)。您还可以使用“Dask”执行分布式和并行计算
相关问题 更多 >
编程相关推荐