使用布尔语句和操作原始数据帧

2024-05-13 07:16:12 发布

您现在位置:Python中文网/ 问答频道 /正文

所以,我有一个数据帧,看起来像:enter image description here

有308个不同的起源城市和12个不同的独特载体

我正试图删除那些唯一航空公司数量不多的城市<;5因此,我执行了以下功能:

enter image description here

现在,我想得到这个结果并处理我的原始数据,df,这样我就可以删除原始城市名称对应的行

我有一个想法,那就是在Python中使用isin()函数或apply(lambda)函数,但我不熟悉如何使用它。有没有更优雅的方法?谢谢你


Tags: 数据lambda函数lt功能名称df数量
1条回答
网友
1楼 · 发布于 2024-05-13 07:16:12

^{}就是为了这个

df.groubpy('ORIGIN_CITY_NAME').filter(
    lambda d: d.UNIQUE_CARRIER.nunique() >= 5
)

然而,继续沿着你试图从中得到结果的脉络

我会用map

mask = df.groubpy('ORIGIN_CITY_NAME').UNIQUE_CARRIER.nunique() >= 5

df[df.ORIGIN_CITY_NAME.map(mask)]

transform

mask = df.groupby('ORIGIN_CITY_NAME').UNIQUE_CARRIER.transform(
    lambda x: x.nunique() >= 5
)

df[mask]

相关问题 更多 >