我有一个熊猫数据框,看起来像这样:
Pr(X,O)
(H, H, H, H) 0.042743
(H, H, H, C) 0.003664
(H, H, C, H) 0.073274
(H, H, C, C) 0.021982
(H, C, H, H) 0.005234
(H, C, H, C) 0.000449
(H, C, C, H) 0.031403
(H, C, C, C) 0.009421
(C, H, H, H) 0.113982
(C, H, H, C) 0.009770
(C, H, C, H) 0.195398
(C, H, C, C) 0.058619
(C, C, H, H) 0.048849
(C, C, H, C) 0.004187
(C, C, C, H) 0.293096
(C, C, C, C) 0.087929
不幸的是,这是由太大的代码生成的,无法在这个问题中发布。注意,我有所有可能的两个元素(H
和C
)作为数据帧索引,它们按四个元素的顺序排列。我的问题是,把每个位置的每个元素的所有数字相加,最好的方法是什么?你知道吗
例如。考虑位置0
和元素H
。在这里我要总结一下
0.042743 + 0.003664 + 0.073274 + 0.021982 + 0.005234 + 0.000449 + 0.031403 + 0.009421
等于0.1887。然后我想在相同的位置对C
做同样的处理,然后在所有的位置上都做同样的处理。(很明显我可以用补码,但我想以后用两个字母的字母表再做一次)。你知道吗
一个期望的结果是另一个熊猫数据帧,看起来像这样:
您可以首先从} ,最后创建^{} :
tuples
创建新列,然后使用aggfunc=sum
创建^{或者如果需要列名作为} (在
int
并删除索引和列名,请使用^{pandas
0.18.0
中新增):我尝试将
itertools.product
的结果作为一个多索引。你知道吗然后我们按不同的级别分组,并连接它们。你知道吗
编辑 多亏了MaxU的评论,不需要将一个多索引作为一个系列对索引进行一些操作。你知道吗
相关问题 更多 >
编程相关推荐