多分量散点图PCA的降维方法

2024-03-29 07:24:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我是新的无监督的数据,需要建议和帮助。你知道吗

我有高维无监督的数据,经过清洗和准备,我留下了形状(13518,44)。 我在数据上应用了StandardScaler。然后我用两种成分进行了主成分分析。我发现PCA变异比-(主成分方差比_)=0.3507。 当我检查PCA(n\u分量=0.90)时,得到23个PCA.n\u分量。 然后,我选择n\u分量作为20,这给了我87%的方差,因为我需要处理85%以上的数据。 然后我计算了20个成分的“解释方差比”,并检查了绘图

我发现前三个主成分方差最大。 我是否可以再次将n\u components=3的PCA应用于包含20个组件的PCA df? 此外,我发现PCA组件=2很容易通过在散点图上绘图来可视化。使用2个以上PCA组件可视化绘图的最佳方法是什么。如果我使用3个PCA组件,那么如何在所有3个PCA的散点图上对簇进行可视化?你知道吗

我将在PCA组件上执行KMeans进行聚类,然后分析每个聚类。请分享您的想法并帮助回答上述问题。你知道吗


Tags: 数据绘图df可视化components组件聚类建议