我有文字和他们的频率计数档案。我想用python中的PCA来降低维数。例如,我有一个文件,其中一行是156 170 177
等等,它描述了不同的单词,在下一行中,我将它们的计数设置为1 3 5 7 etc
。
所以我的档案是:
150 112 139 150 177
1 2 3 10 15
我想通过降维来减少数据的大小,这样我就可以删除多余的单词和它们的计数。我采用了PCA方法。我执行了标准化,然后去掉了平均值。然后我生成了协方差矩阵,但是协方差矩阵只给出了1x1矩阵,也就是说,只有1个数字。有人能指导我如何用python解决问题吗
Tags:
目前没有回答
相关问题 更多 >
编程相关推荐