当我把一个DEAP的日志(本质上是一个字典列表)和大约10毫米的条目转换成一个数据帧进行进一步处理时,我得到了一条关于GoogleColab内存溢出的消息
我正在使用DEAP软件包做一些实验,因为我的机器又慢又旧,我一直在用谷歌的Colab服务自助。 模拟的结果是DEAP的日志,这是一个字典列表。每个字典都是模拟屏幕截图的重要值的摘要。 我一直在将这个字典列表转换为数据帧进行分析,但对于最大的模拟,进程崩溃是因为它超过了分配的RAM
字典存储此类值:
logbook[-1]
{'avg': 16.72180244532359,
'b_ratio': 5,
'best': 0.006420736818512296,
'births': 80160,
'cx_pb': 0.9,
'exp': 128,
'k_par': 6,
'k_sur': 6,
'med': 2.6377157552245727,
'mut_pb': 0.9,
'mut_sig': 7.5,
'pop': 160,
'rep': 40,
'seed': 112,
'std': 20.059567935625164,
'worst': 55.23488779660829}
我感兴趣的是将日志存储为熊猫数据帧,日志长度在10毫米到12毫米之间。稍后,我将把这个数字减少到大约五分之一
在酸洗和拆开日志后,我看到我使用的是分配的12.7GB中的大约7.7GB
我试过:
from itertools import chain
fitness_res = pd.DataFrame(list(chain.from_iterable(logbook)))
及
pop_records = [record for record in logbook]
fitness_res = pd.DataFrame(pop_records)
没有成功
我得到的错误是:
Your session crashed after using all available RAM. View runtime logs
我希望有一个包含DEAP日志中所有数据的数据框架
pandas
中的数据帧将所有数据加载到内存中。您使用的方法是在将数据传递到pandas
以存储在数据帧中之前,使用额外的内存加载数据;e、 g这意味着在将数据传递到
pd.DataFrame
之前,您正在创建一个包含所有读取值的列表鉴于第二种方法:
您正在使用列表理解创建一个列表,该列表在将所有数据传递给
pandas
之前再次将其加载到内存中我的建议是使用^{} 直接在pickled文件上使用pandas数据加载功能:
相关问题 更多 >
编程相关推荐