在多标签矩阵中使用权重代替数字

2024-04-19 09:44:25 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我们有一个multiclassification问题。 数据矩阵存储表示标签的整数。你知道吗

float()或下面的某种概率建立这样的矩阵是正确的吗

[[0.71561032442075889, 0.27956959249497948], ...]

而不是像这样的二进制标签:

[[0, 1], ...]

非常感谢!你知道吗


Tags: 数据二进制矩阵整数标签float概率multiclassification
1条回答
网友
1楼 · 发布于 2024-04-19 09:44:25

一般来说,classification是一项任务,根据类的共同属性和核心特征,将给定的集(输入)划分为N个类。如果只有两个类(N==2),那么问题将是二进制分类。作为一般规则,此类类以从零开始的整数表示:

X = [[1, 2], [3, 4], [1, 2]]
y = [1, 0, 1]  # two classes => binary classification task

如果您有两个以上的类(N>;2),那么这将是一个多重分类任务。请注意,我们不考虑任何转换技术:

X = [[1, 2], [3, 4], [1, 2], [5, 6]]
y = [1, 0, 1, 2]  # three classes => multiclassifaction task

除了对输入数据进行分类外,还有一项任务是建立回归。分类分析和regression analysis之间的主要区别在于,我们努力在输入和目标之间建立一个坚实的数学关系。在回归分析中,我们可能会提出的一个主要问题是,当某个输入发生变化时,目标变量会发生什么变化。在这种情况下,目标向量是以连续的比例表示的,即它可以由任何数字组成,无论是正的还是负的:

X = [[1, 2], [3, 4], [1, 2], [3, 1]]
y = [12.5, -36.8, 12.5, 22.32]  # regression problem

简要建议

如果你想重建你的y来解决多重分类问题,你首先应该有一个有效的和合理的技术来把你的二进制目标转换成连续的目标,就像你在问题中展示的那样。如果您相信您的方法遵循常识,那么您可以将y向量的值舍入为小数,从而建立十一个类:[0.0, 0.1, ..., 0.9, 1]。当然,下一步将是用转换后的数据拟合分类器。你知道吗

我希望这有帮助。你知道吗

相关问题 更多 >