我有下面的数据框,葡萄酒品种,评论员和分数。我想制作一个新的数据框,它输出variable作为列标签,并按reviewer和variable列出平均分数。简单地说,我想输出一个数据帧,顶部是variable,reviewer作为索引,其中包含reviewer和variable的平均得分。我试过好几件事,但都没成功。你知道吗
实际的资料我会有更多的审稿人和更多的品种,但我想提供一个简化的版本。你知道吗
任何帮助都将不胜感激。先谢谢你。你知道吗
import pandas as pd
df = pd.DataFrame({"Variety": ['Cabernet', 'Pinot', 'Cabernet', 'Pinot', 'Pinot', 'Cabernet', 'Pinot', 'Cabernet'],
"Reviewer": ['Bill', 'Sally', 'Bill', 'Sally', 'Bill', 'Sally', 'Bill', 'Sally'],
"Score": [90, 85, 87, 93, 80, 81, 93, 88]})
更像是一个
pivot
问题您可以按分组、计算平均值和透视结果:
第一行计算平均值,最后一行适当地重塑数据帧。第二行是获得
.mean()
的输出的必要条件,它的形状适合pivot()
函数。你知道吗一步一步地:
我们现在可以使用
pd.pivot()
将其从“长格式”转换为“宽格式”,并在本文顶部获得结果。你知道吗您可以尝试:
相关问题 更多 >
编程相关推荐