m = {'A':[1,2,3,4,5,6,7],
'B':[12,13,14,15,16,17,18]}
p = {'A':[8,9,10,11,12,13,14],
'B':[18,19,20,21,22,23,24]}
p_df = pd.DataFrame(p).melt(value_name='value')
m_df = pd.DataFrame(m).melt(value_name='value')
p_df['category'] = 'P'
m_df['category'] = 'M'
result = pd.concat([m_df, p_df], ignore_index=True)
基准(对于更大的数据集):
^{pr2}$
开始吧:
^{3}$
每个回路120 ms±3.16 ms(平均值±标准偏差,7次运行,每个回路10次)
%%timeit
categories = ['M', 'P']
dcts = [m, p]
dfs = [
pd.DataFrame([[k, el, cat] for k, v in dct.items() for el in v])
for dct, cat in zip(dcts, categories)
]
cols = {'columns': {0: 'Name', 1: 'Value', 2: 'Category'}}
result = pd.concat(dfs).reset_index(drop=True).rename(**cols)
设置
假设您知道哪个类别对应哪个字典,那么您可以重新构造字典并使用
^{pr2}$ ^{3}$concat
:解决方案
这里有一个比用户3483203所建议的方法更适合的方法。这避免了不必要的迭代,速度更快(对于足够大的数据集),并且更具惯用性。在
基准(对于更大的数据集):
^{pr2}$开始吧:
^{3}$每个回路120 ms±3.16 ms(平均值±标准偏差,7次运行,每个回路10次)
每个回路207 ms±8.9 ms(平均值±标准偏差,7次运行,每个回路1次)
相关问题 更多 >
编程相关推荐