我在数据帧df上使用了df.describe( )
,结果是:
Index count mean std min 25% max
ABC 6 5.14 4.63 1 2 12
CDE 6 18.6 12.5 2 7.5 15
DEF 7 30.2 32.6 1 6.5 20
另一个数据帧df2
Index Date eventName eventCount
0 2017-08-09 ABC 24
1 2017-08-09 CDE 140
2 2017-08-10 CDE 150
3 2017-08-11 DEF 200
其中阈值列应计算为:
例如,对于事件名称:ABC使用数据帧df2中的日期:2017-08-09(每日)作为新数据帧中的新索引,存储在新数据帧中的日期:2017-08-09的偏差百分比将是表示数据帧df2中ABC的eventCount列中的值:24减去该值在数据帧df的min列中,也就是1代表ABC:24-1=23,然后除以df2*(100)中ABC的事件计数值,即23/24*100=95%
生成的(新)数据帧应如下所示:
Index eventName eventCount threshold min
2017-08-09 ABC 24 Under 95% 1
2017-08-09 CDE 140 Under 98.5% 2
2017-08-10 CDE 150 Under 99.3% 2
2017-08-11 DEF 200 Under 99.5% 1
我已经卡住了,我该怎么办?你知道吗
使用^{} (默认情况下
left
)添加新列,然后执行一些算术运算:相关问题 更多 >
编程相关推荐