我尝试计算每个会话中现有数据帧不同时段的频率:
session time date period
1 05:51:53 2015-05-22 night
1 05:52:59 2015-05-22 night
1 06:08:24 2015-05-22 night
1 06:09:06 2015-05-22 night
1 08:25:31 2015-05-22 morning
2 08:25:35 2015-05-22 morning
2 08:26:37 2015-05-22 morning
2 08:27:11 2015-05-22 morning
2 12:33:17 2015-05-22 noon
3 12:33:45 2015-05-22 noon
为了得到像这样的东西:
^{pr2}$我用这个方法
df['frequency'] = df.groupby('session', as_index=False)['period'].apply(lambda x: x.value_counts())
我有个错误:TypeError: incompatible index of inserted column with frame index
如果我将.value_counts
直接应用于groupby
作为
df['frequency'] = df.groupby('session', as_index=False)['period'].value_counts()
我有一个错误,groupby
方法没有属性value_counts
您能告诉我如何计算这些分类值,同时将结果列添加到现有的dataframe中(我相信as_index=False
可以解决这个问题,但显然不是)
您可以在
'session', 'period'
上groupby
并找到组的大小相关问题 更多 >
编程相关推荐