如何将此数据帧转换为按索引值平均得分的数据帧？

import pandas as pd df = pd.DataFrame({"Variety": ['Cabernet', 'Pinot', 'Cabernet', 'Pinot', 'Pinot', 'Cabernet', 'Pinot', 'Cabernet'], "Reviewer": ['Bill', 'Sally', 'Bill', 'Sally', 'Bill', 'Sally', 'Bill', 'Sally'], "Score": [90, 85, 87, 93, 80, 81, 93, 88]})

3条回答

网友

1楼 · 编辑于 2024-06-16 11:10:32

更像是一个pivot问题

pd.pivot_table(df,index='Reviewer',columns='Variety',values='Score',aggfunc='mean')
Out[29]: 
Variety    Cabernet      Pinot
Reviewer                      
Bill      87.000000  87.666667
Sally     84.666667  93.000000

网友

2楼 · 编辑于 2024-06-16 11:10:32

您可以按分组、计算平均值和透视结果：

df.groupby(['Variety', 'Reviewer']).mean() \
                                   .reset_index() \
                                   .pivot(index='Reviewer', columns='Variety')
                Score      
Variety  Cabernet Pinot
Reviewer               
Bill         88.5  86.5
Sally        84.5  89.0

第一行计算平均值，最后一行适当地重塑数据帧。第二行是获得.mean()的输出的必要条件，它的形状适合pivot()函数。你知道吗

一步一步地：

df.groupby(['Variety', 'Reviewer']).mean()
                  Score
Variety  Reviewer       
Cabernet Bill       88.5
         Sally      84.5
Pinot    Bill       86.5
         Sally      89.0

df.groupby(['Variety', 'Reviewer']).mean().reset_index()
        Variety Reviewer  Score
0  Cabernet     Bill   88.5
1  Cabernet    Sally   84.5
2     Pinot     Bill   86.5
3     Pinot    Sally   89.0

我们现在可以使用pd.pivot()将其从“长格式”转换为“宽格式”，并在本文顶部获得结果。你知道吗

网友

3楼 · 编辑于 2024-06-16 11:10:32

您可以尝试：

>>> df.groupby(['Reviewer', 'Variety']).mean()
                   Score
Reviewer Variety
Bill     Cabernet   88.5
         Pinot      86.5
Sally    Cabernet   84.5
         Pinot      89.0

相关问题更多 >

编程相关推荐

热门问题

热门文章