Pandas groupby提供任何非nan值

2024-04-19 05:23:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图在给定groupby索引的表上执行groupby,其中所有值要么正确要么为Nan。例如:

    id country    name
0    1  France    None
1    1  France  Pierre
2    2    None   Marge
3    1    None  Pierre
4    3     USA     Jim
5    3    None     Jim
6    2      UK    None
7    4   Spain  Alvaro
8    2    None   Marge
9    3    None     Jim
10   4   Spain    None
11   3    None     Jim

我只想得到这4个人的价值观,不应该冲突,例如:

^{pr2}$

我试过:

^{3}$

甚至

groupby().apply(lambda x: x.loc[x.first_valid_index()])

一切都无济于事。我错过了什么?在

编辑:为了帮助您制作用于测试的示例数据帧:

df = pd.DataFrame({'id':[1,1,2,1,3,3,2,4,2,3,4,3],'country':['France','France',None,None,'USA',None,'UK','Spain',None,None,'Spain',None],'name':[None,'Pierre','Marge','Pierre','Jim','Jim',None,'Alvaro','Marge','Jim',None,'Jim']})

Tags: namenoneidnancountrygroupbyuk价值观
2条回答

值为None时可能指定为dropna

df.groupby('id').first(dropna=True)

   country    name
id                
1   France  Pierre
2       UK   Marge
3      USA     Jim
4    Spain  Alvaro

Pandasgroupby.first返回first not null值,但不支持None,try

df.fillna(np.nan).groupby('id').first()

    country name
id      
1   France  Pierre
2   UK      Marge
3   USA     Jim
4   Spain   Alvaro

相关问题 更多 >