我有一个由两列组成的数据集,每列是一个类别,每行代表一个用户。用户在一列中有一个年龄范围,在另一列中有一个类别(A-E)
我想找出每个年龄段的用户在每个类别中的百分比。
例如:
18-25: A - 25%, B - 35%, C - 30%, D - 5%, E - 5%
26-40: A - 15%, B - 45%, C - 10%, D - 15%, E - 15%
有了这些信息,我想创建一种热图,其中年龄范围向下延伸
分类也排在最前面。每个细胞的“热度”就是相应类别/年龄范围的百分比有多高
任何帮助都将不胜感激
谢谢
Tags:
以下是我使用pandas、numpy和seaborn的解决方案:
其中
df
是一个(nRows,2)大小的数据框,列为“年龄”和“类别”,而summaryTable
是一个数据框,列为年龄组,行为a-E类别下面是一个示例输出热图:
相关问题 更多 >
编程相关推荐