如何在Colab中将一个较长的DEAP日志（10 MM）转换为数据帧时修复RAM限制？

logbook[-1] {'avg': 16.72180244532359, 'b_ratio': 5, 'best': 0.006420736818512296, 'births': 80160, 'cx_pb': 0.9, 'exp': 128, 'k_par': 6, 'k_sur': 6, 'med': 2.6377157552245727, 'mut_pb': 0.9, 'mut_sig': 7.5, 'pop': 160, 'rep': 40, 'seed': 112, 'std': 20.059567935625164, 'worst': 55.23488779660829}

1条回答

网友

1楼 · 发布于 2024-05-28 03:58:24

pandas中的数据帧将所有数据加载到内存中。您使用的方法是在将数据传递到pandas以存储在数据帧中之前，使用额外的内存加载数据；e、 g

from itertools import chain
fitness_res = pd.DataFrame(list(chain.from_iterable(logbook)))

这意味着在将数据传递到pd.DataFrame之前，您正在创建一个包含所有读取值的列表

鉴于第二种方法：

pop_records = [record for record in logbook]
fitness_res = pd.DataFrame(pop_records)

您正在使用列表理解创建一个列表，该列表在将所有数据传递给pandas之前再次将其加载到内存中

我的建议是使用^{}直接在pickled文件上使用pandas数据加载功能：

fitness_res = pd.read_pickle(pickle_file_path)

相关问题更多 >

编程相关推荐

热门问题

热门文章