Panel data保留至少有3年数据的公司

year ticker return_y 0 1985 VLID -0.5838 1 1985 KO 0.3245 2 1994 CTL -0.3063 3 1996 DRYR -0.1607 .. ... ... ... 1356 2002 CHUX -0.2456 1357 1987 HRL -0.0233 1358 2015 KO 0.2343 .. ... ... ... 56798 2017 AFMXF 0.0558 56799 2014 TER 0.0134

2条回答

网友

1楼 · 编辑于 2024-06-11 02:23:30

也许还有一条更短的路。我的尝试；假设每个组有一年，我将创建一个新列，通过将groupby链接到cumcount，将每个组从1开始编号

df['group']=df.groupby(['ticker']).cumcount()+1
df2=df[df['group']>=3]
df2

在每组中找出最大值，并删除最大值小于3的任何内容

df['group']=df.groupby(['ticker']).cumcount()+1
df['Max']=df.groupby('ticker')['group'].transform('max')
df[df['Max']>=3]

网友

2楼 · 编辑于 2024-06-11 02:23:30

您可以在一行中处理这个问题：使用lambda调用groupby.filter()：

df.groupby(df.ticker).filter(lambda x: len(x) > 2)

编程相关推荐

java在Jpanel中删除或隐藏工具栏面板
如何将Java API文档添加到Eclipse？
java从twitter中提取推文的位置
特定字典中的java文本匹配
java属性在树模型的内部类上不可读
maven mvn exec:java失败，出现FileNotFoundException
java无法实现不安全线程
java向JDK11的迁移改变了必须从Maven运行测试的方式
java如何在不同网络NAT后面的两个客户端之间建立TCP连接？
如何在JavaSelenium中使用PageObjects和@FindBy执行javascript元素

相关问题更多 >

编程相关推荐

热门问题

热门文章

Panel data保留至少有3年数据的公司

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >