通过Pandas GroupBy可视化类特征中的值

网友

1楼 · 编辑于 2024-04-19 21:06:29

使用seaborn的解决方案

import seaborn as sns
ndf = pd.melt(df, id_vars="CLASS", var_name="feature", value_name="val")
sns.catplot("feature", "val", col="CLASS", data=ndf, kind="bar", col_wrap=1)
plt.show()

网友

2楼 · 编辑于 2024-04-19 21:06:29

通过@meW提供的解决方案，我能够实现接近我目标的结果。你知道吗

我必须做两个步骤才能真正使用他的解决方案。你知道吗

通过df = pd.DataFrame(df.groupBy('Class').count().rsub(df.groupby('Class').size(), axis =0)将GroupBy对象强制转换为DataFrame对象
通过groupby查询，类列被转换为索引，因此我必须通过grouped['class'] = grouped.index将其转换回来

这个解决方案引发了两个问题：是否有可能使蜱虫适应不同数量的nan。因为在features中有只有5-10个nan值的类，也有超过1000个nan值的类。（见图）

第二个问题-特征名称只显示在最后一个绘图中-有没有办法将它们添加到所有绘图的所有x轴

网友

3楼 · 编辑于 2024-04-19 21:06:29

分组是方法，只需设置标签

for name, grp in df3.groupby('CLASS'):
    ax = grp.plot.bar()
    ax.set_xticks([])
    ax.set_xlabel(name)

相关问题更多 >

编程相关推荐

热门问题

热门文章

通过Pandas GroupBy可视化类特征中的值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >