熊猫数据框中有两列:label(地面真相)和pred(模型预测)。我有4个类别的标签:狗,猫,大象和蛇。我想要的是每类预测的准确性或精确性。例如,如果我有下面的dataframe:
label pred
dog cat
elephant elephant
dog snake
cat cat
snake snake
snake cat
dog dog
我所做的是为每个类使用value_计数,然后手动插入比率,以获得pandas中的精度。问题在于,值_计数按原始计数编号排序,因此标签和pred的顺序可能不同
numerators = df[pred].value_counts()
denominators = df[label].value_counts()
然后我得到输出:
dog 0.33
cat 1
snake 0.5
elephant 1
有没有办法在熊猫身上实现自动化
您可以检查两列是否相等,然后
groupby
第一列和mean
:让我们试试
pd.crosstab
,在得到矩阵后,我们可以做热图来查看相关性本的回答很快就解决了你的问题。我只想添加混淆矩阵:
输出:
相关问题 更多 >
编程相关推荐