groupby中每行的唯一值

网友

1楼 · 编辑于 2024-05-12 20:26:22

另一种方法是将索引设置为Person和stack以删除任何空值，然后我们可以毫无问题地应用任何group by参数

df.set_index('Person').stack().groupby('Person')\
                .agg(JobDetails=('unique'), Job=('count'))

          JobDetails  Job
Person                   
Cathy   [j1, j3, j5]    4
Mark            [j2]    1
Steve           [j4]    1

网友

2楼 · 编辑于 2024-05-12 20:26:22

用dropna添加unique链

df.groupby('Person').agg(CountJob=('Job','count'),
                         JobDetails=('Job',lambda x: ';'.join(x.dropna().unique()))
                        )
Out[143]: 
        CountJob JobDetails
Person                     
Cathy          4   j1;j3;j5
Mark           1         j2
Steve          1         j4

网友

3楼 · 编辑于 2024-05-12 20:26:22

可以考虑在聚合之前放弃null：

   (
    df.dropna()
    .groupby("Person")
    .agg(CountJob=("Job", "count"), JobDetails=("Job", set))
    .assign(JobDetails=lambda df: df.JobDetails.str.join(","))
)

      CountJob  JobDetails
Person      
Cathy   4   j1,j3,j5
Mark    1   j2
Steve   1   j4

相关问题更多 >

编程相关推荐

热门问题

热门文章

groupby中每行的唯一值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >