评估多类分类器性能的好指标是什么？

2条回答

网友

1楼 · 编辑于 2024-04-27 00:44:33

首先，我发现很难查看混淆表。把它画成一幅图像会让你更好地直观地了解发生了什么。在

建议使用单数字指标进行优化，因为这样更容易、更快。当你发现你的系统没有达到你期望的效果时，修改你选择的度量。在

如果每个类中有相同数量的示例，那么准确度通常是一个很好的度量标准。否则（这里似乎就是这样）我建议使用F1 score，它考虑了你的估计器的precision and recall。在

编辑：然而，这是由你来决定是否约25%的准确性，或任何指标是“足够好”。如果你在分类机器人是否应该射杀一个人，你可能应该修改你的算法，但如果你决定这是一个伪随机数据还是随机数据，25%的准确率可能足以证明这一点。在

网友

2楼 · 编辑于 2024-04-27 00:44:33

如果这个表是一个混淆表，我认为你的分类器在大部分时间里预测了E类。我认为你的E类在你的数据集中所占的比例过高，如果你的类的实例数不相同，那么准确度就不是一个好的衡量标准，例如，如果你有3个类，A，B，C，并且在测试数据集中，类A被过度表示（90%），如果你的分类器预测所有时间的类A，你将有90%的准确率

一个好的度量是使用对数损失，logistic回归是优化该度量的一个很好的算法见https://stats.stackexchange.com/questions/113301/multi-class-logarithmic-loss-function-per-class

另一个解决方案是对你的小类进行过采样

相关问题更多 >

编程相关推荐

热门问题

热门文章