使用Python读取添加到hdfs文件的最后一批数据

2024-04-27 15:01:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个程序,可以将可变数量的数据行添加到hdf5文件中,如下所示

data_without_cosmic.to_hdf(new_file,key='s', append=True, mode='r+', format='table')

New_file是文件名,data_without_cosmic是一个数据框,其中包含表示位置数据和标量的“x”、“y”、“z”和“i”列。每次运行完整程序时,我可能会将此表单的几个数据帧添加到文件中。对于我添加的每个数据帧,“z”值都是一个常量值

下次使用该程序时,我需要访问添加到数据中的最后一批行,以便执行一些操作。我想知道是否有一种快速的方法来检索添加到文件中的最后一个数据帧,或者是否可以在添加数据时以某种方式对数据进行分组,以便能够这样做

我能想到的实现目标的唯一其他方法是读取整个文件,然后自下而上检查z值,直到它发生变化,但这似乎有点过分。有什么想法吗

另外,我对hdf5文件的使用非常缺乏经验,但我了解到它们的使用效率很高


Tags: 文件to数据方法key程序newdata