我有一个如下所示的数据帧。col_1
中的元素连接到col_2
中的元素,得到output_1
中的结果。但是,col_2
中的一些元素现在也在col_1
中。例如,while a-->b= 3
,b-->a= 24
。你知道吗
col_1 col_2 output_1 average
a b 3 13.5 (because a-->b=3 and b-->a=24)
a c 5 3.5 (because a-->c=5 and c-->a=2)
a d 3
b a 24
b c 12
b d 5
c a 2
c b 3
c d 5
我需要的是计算这两个值的平均值,当然还有数据帧中所有类似的情况。你知道吗
您可以这样想数据:col_1
中的人正在调用col_2
中的人。输出是duration
。我想计算每对人之间的平均持续时间。col_1
和col_2
具有字符串值,而第三列“output”具有数字值。你知道吗
我试过使用pd.merge(df.col_1, df.col_2)
,但没有成功。
如有任何建议,我们将不胜感激。你知道吗
试试这个。列
col_12
可以删除,也可以进一步用作对唯一键(与元素顺序无关)。你知道吗和输出:
我会使用numpy广播:
我得到的结果如下:
编辑
你可以试试
感谢@baccandr的更正
相关问题 更多 >
编程相关推荐