我有一些数据帧。它们都有相同的列和相同的索引。对于每个索引,我想平均每列中的值(如果这些是矩阵,我只需将它们相加并除以矩阵的数目)。在
这是一个例子。在
v1 = pd.DataFrame([['ind1', 1, 2, 3], ['ind2', 4, 5, 6]], columns=['id', 'c1', 'c2', 'c3']).set_index('id')
v2 = pd.DataFrame([['ind1', 2, 3, 4], ['ind2', 6, 1, 2]], columns=['id', 'c1', 'c2', 'c3']).set_index('id')
v3 = pd.DataFrame([['ind1', 1, 2, 1], ['ind2', 1, 1, 3]], columns=['id', 'c1', 'c2', 'c3']).set_index('id')
在实际情况下,索引和列的顺序可能不同。在
对于这种情况,结果是
(ind1,c1的值是(1 + 1 + 2) / 3
,对于ind2,c2是(1 + 5 + 1) / 3
,依此类推)。在
目前,我使用循环:
^{pr2}$,但对于具有大量列的大数据帧,这显然是低效的。那么,如果没有循环,我怎么能做到这一点呢?在
在连接数据帧之后,可以在} :
index
级别上使用^{相关问题 更多 >
编程相关推荐