H2O.ai导入_文件看起来不像惰性评估,它在做什么?

2024-04-27 22:30:12 发布

您现在位置:Python中文网/ 问答频道 /正文

H2O.ai数据解析到底在做什么

Import h2o
h2o.init()
df = h2o.import_file(path=myfilepath)

当我运行上面的代码时,我得到下面的输出,这需要一段时间

Parse progress: [###################################] 100%

当我在2GB的数据上运行它时,我的内存大约增加了2GB。我以为H2O.ai应该使用惰性评估?看起来很多信息都存储在内存中(甚至可能是整个数据集),显然这不是一个懒惰的评估,因为它需要一段时间才能运行

H2O.ai文档也不是很有用

http://docs.h2o.ai/h2o/latest-stable/h2o-py/docs/h2o.html#h2o.import_file

http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-munging/importing-data.html

有人知道这里到底发生了什么吗


Tags: 数据内存importhttpdocsdatainithtml