2024-05-13 07:16:12 发布
网友
所以,我有一个数据帧,看起来像:
有308个不同的起源城市和12个不同的独特载体
我正试图删除那些唯一航空公司数量不多的城市<;5因此,我执行了以下功能:
现在,我想得到这个结果并处理我的原始数据,df,这样我就可以删除原始城市名称对应的行
我有一个想法,那就是在Python中使用isin()函数或apply(lambda)函数,但我不熟悉如何使用它。有没有更优雅的方法?谢谢你
^{}就是为了这个
df.groubpy('ORIGIN_CITY_NAME').filter( lambda d: d.UNIQUE_CARRIER.nunique() >= 5 )
然而,继续沿着你试图从中得到结果的脉络
我会用map
map
mask = df.groubpy('ORIGIN_CITY_NAME').UNIQUE_CARRIER.nunique() >= 5 df[df.ORIGIN_CITY_NAME.map(mask)]
或transform
transform
mask = df.groupby('ORIGIN_CITY_NAME').UNIQUE_CARRIER.transform( lambda x: x.nunique() >= 5 ) df[mask]
^{} 就是为了这个
然而,继续沿着你试图从中得到结果的脉络
我会用
map
或
transform
相关问题 更多 >
编程相关推荐