能否逆转sklearn中KMeans的变换?
在用sklearn.cluster.KMeans对一个数据集进行聚类后,我们把数据转换成了距离中心点的形式。现在的问题是,给定这些中心点,我们能不能把这个转换过程反过来,找回原来的特征数据呢?
1 个回答
6
不,这不可能。任何降维技术一般来说都是一种有损操作。如果你丢掉了一些维度,就无法再找回这些信息。这里的“一般来说”是指对于某些可能的数据集。有些数据集可能存在冗余信息,如果某种降维技术能够完美利用这些冗余信息,那么就有可能实现完美的逆变换。
下面的图片中,我画了一个简单的例子。你可以把很多不同的三维空间中的点配置投影到同一个二维空间的点配置上。所以仅仅根据二维空间的信息,你无法猜测这些点来自哪个三维配置。你不知道它们的z坐标值,而可能的组合是无穷无尽的。