1特征向量python的降维

2024-04-26 21:24:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我有文字和他们的频率计数档案。我想用python中的PCA来降低维数。例如,我有一个文件,其中一行是156 170 177等等,它描述了不同的单词,在下一行中,我将它们的计数设置为1 3 5 7 etc。 所以我的档案是:

150 112 139 150 177
  1   2   3   10 15

我想通过降维来减少数据的大小,这样我就可以删除多余的单词和它们的计数。我采用了PCA方法。我执行了标准化,然后去掉了平均值。然后我生成了协方差矩阵,但是协方差矩阵只给出了1x1矩阵,也就是说,只有1个数字。有人能指导我如何用python解决问题吗


Tags: 文件数据方法etc矩阵数字档案单词