绘制不平衡数据集

2024-05-15 08:26:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个高度不平衡的数据集。我已将标签及其相应计数放入熊猫数据框中,如下所示:

lbl = ['NOT', 'OFF', 'TIN', 'UNT', 'IND', 'GRP', 'OTH']
count = [7626816, 1446580, 147955, 40772, 93638, 16768, 3396]
df = pd.DataFrame({'label':lbl, 'count':count})
    label   count

0   NOT     7626816
1   OFF     1446580
2   TIN     147955
3   UNT     40772
4   IND     93638
5   GRP     16768
6   OTH     3396

我想用一种好的可视化方法来展示这种不平衡。根据我对绘图样式和{}的有限知识,以下是我到目前为止得出的结论

首先,带有sns.countplot的条形图会导致较小的类根本不显示在图中。在{}中,这些类彼此太接近,没有任何意义

bar plotenter image description here

#pieplot
colors = ["#E13F29", "#D69A80", "#D63B59", "#AE5552", "#CB5C3B", "#EB8076", "#96624E"]

plt.pie(
    df['count'],
    labels = df['label'],
    shadow = False,
    colors = colors,
    startangle=90,
    autopct='%1.1f%%'
)
plt.axis('equal')
plt.tight_layout()
plt.show()

pie plot

如何绘制此数据集,使其正确表示不平衡?应使用哪种类型的绘图


Tags: 数据绘图dfcountnotpltlabelunt