pandas使用分类数据和大量nan值连接rows/groupby

Name Sex Shoes Bike Car 0 John Male Specialised 1 John Male Bridgestone 2 Lucy Female BMW 3 John Male Vans 4 Lucy Female Nike

3条回答

网友

1楼 · 编辑于 2024-06-06 14:12:05

您可以使用空字符串fillna，然后在末尾清除坏数据。你知道吗

u = df.fillna('').groupby(['Name', 'Sex']).agg(', '.join)
u.stack().str.replace('(, ){2,}|^, |, $', '').unstack()

            Shoes                      Bike  Car
Name Sex
John Male    Vans  Specialised, Bridgestone
Lucy Female  Nike                            BMW

_{正则表达式的顺序非常重要}

网友

2楼 · 编辑于 2024-06-06 14:12:05

假设空单元格为NaN（非空字符串），则以下操作将获得结果

(df.set_index(['Name','Sex']) 
   .groupby(level=[0,1])
   .apply(lambda x:x.apply(lambda y: ', '.join(y.dropna())))
   .reset_index())

第二种方法

(df.set_index(['Name','Sex'])
   .stack()
   .groupby(level=[0,1,2])
   .apply(', '.join)
   .unstack()
   .reset_index()

网友

3楼 · 编辑于 2024-06-06 14:12:05

您可以通过如下方式使用此组

df = pd.DataFrame([['John', 'Male', 'na', 'Specialised', 'na'], ['John', 'Male', 'na', 'Bridgestone', 'na'], ['Lucy', 'Female', 'na', 'na', 'BMW'], ['John', 'Male', 'Vans', 'na', 'na'], ['Lucy', 'Female', 'Nike', 'na', 'na']], columns=('Name', 'Sex', 'Shoes', 'Bike', 'Car'))
df = df.mask(df == "na", '')

df.groupby(["Name", "Sex"]).agg(lambda row: ",".
                                join([val for val in row if val.strip()!=""]))

相关问题更多 >

编程相关推荐

热门问题

热门文章

pandas使用分类数据和大量nan值连接rows/groupby

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >