我有一个高度不平衡的数据集。我已将标签及其相应计数放入熊猫数据框中,如下所示:
lbl = ['NOT', 'OFF', 'TIN', 'UNT', 'IND', 'GRP', 'OTH']
count = [7626816, 1446580, 147955, 40772, 93638, 16768, 3396]
df = pd.DataFrame({'label':lbl, 'count':count})
label count
0 NOT 7626816
1 OFF 1446580
2 TIN 147955
3 UNT 40772
4 IND 93638
5 GRP 16768
6 OTH 3396
我想用一种好的可视化方法来展示这种不平衡。根据我对绘图样式和{
首先,带有sns.countplot
的条形图会导致较小的类根本不显示在图中。在{
#pieplot
colors = ["#E13F29", "#D69A80", "#D63B59", "#AE5552", "#CB5C3B", "#EB8076", "#96624E"]
plt.pie(
df['count'],
labels = df['label'],
shadow = False,
colors = colors,
startangle=90,
autopct='%1.1f%%'
)
plt.axis('equal')
plt.tight_layout()
plt.show()
如何绘制此数据集,使其正确表示不平衡?应使用哪种类型的绘图
目前没有回答
相关问题 更多 >
编程相关推荐