小黑斑羚

1条回答

网友

1楼 · 发布于 2024-05-29 11:39:01

下面是groupby（无下划线）的示例：

df = pd.DataFrame({"id":["a","b","a","b","c","c"], "timestamp":[1,2,3,4,5,6]})

为您的timestamp创建一个grouper列。在

^{pr2}$

也可以同时使用：

df["something that I need"] = df["my interval"] & (df["id"] == "b")
df.groupby(["something that I need"]).agg("count")["dummy"]

您可能还需要应用整数除法来生成时间间隔：

df = pd.DataFrame({"id":["a","b","a","b","c","c"], "timestamp":[1,2,13,14,25,26], "sales": [0,4,2,3,6,7]})
epoch = 10
df["my interval"] = epoch* (df["timestamp"] // epoch)
df.groupby(["my interval"]).agg(sum)["sales"]

编辑：

你的例子：

import pandas as pd
A = "A"
B = "B"
df = pd.DataFrame({"id":[A,A,A,B,B], "timestamp":[5,7,3,9,5]})
df["dummy"] = 1

解决方案：

grouper = (df["id"] == A) & (4 < df["timestamp"] ) & ( df["timestamp"] < 11)
df.groupby( grouper ).agg(sum)["dummy"]

或更好：

df[grouper]["dummy"].sum()

编辑：

相关问题更多 >

编程相关推荐

热门问题

热门文章

小黑斑羚

编辑：

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >