将min()与groupby一起使用

2024-06-16 08:55:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我在找类似的东西 Keep other columns when using min() with groupby。。。你知道吗

当我只看一个实验/数据集时

df.sort_values("variableA").groupby("variableB", as_index=False).first()

一切正常。你知道吗


现在我有了一个很大的数据框架,有很多不同的实验和数据处理选项(我们称之为is processingoption1,…,processingoption4)。你知道吗

Experiment processingoption1 processingoption2 processingoption3 processingoption4 variable1 variable2 variable3

processingoption1
processingoption2
processingoption3
processingoption4
are categorial 

variableA
variableB
variableC
are numerical 

数据帧必须具有以下样式

experimentname processingoption1    processingoption2   processingoption3 processingoption4 variableA variableB variableC  
experiment1         1                       2                   'mode3'              '19'                        

我试过了

combined_df.sort_values('variableA').groupby(['variableB','processingoption1','processingoption2','processingoption3','processingoption4',as_index=False).first()

但这并没有奏效。结果和我单独做实验时不同。你知道吗

仅使用数据帧

experiment variableA variableB variableC  

然后呢

combined_df.sort_values('variableA').groupby('variableB',as_index=False).first()

给出了预期的结果

我在想是不是 pandas groupby sort within groups

稍后我想创建一个透视表

pivot_table(index=['experiment','processingoption1','processingoption2','processingoption3'],columns='variableB',values='variableC') ]

你知道吗?你知道吗


Tags: 数据falsedfindexassortvaluesgroupby