Documentsterms矩阵降维我正在使用Python使用分层聚类方法处理文本文档聚类 我有一个10k文档的语料库,并基于整个语料库中分类为“关键字”的术语集合,在字典上构建了一个文档术语矩阵。 矩阵的形状为:[10000 x 20 ...2024-05-15 已阅读: n次
运行自定义函数显示“AttributeError:'module'object has no attribute”我为特征联合定义了一个类。Python2.7抱怨“AttributeError:'module'对象没有属性”TextTransformer“。代码可以在Kaggle的平台上运行,但不能在我的本地ip ...2024-05-15 已阅读: n次
CSR稀疏矩阵和截断SVD拟合NLP/主题建模我正在做一个主题建模项目。在这种情况下,我希望在应用KMeans之前使用截断的SVD来降低文档矩阵的维数 我已经对原始文档进行了处理(即清理、标记化、柠檬化)和矢量化。我已经应用了Tf Idf矢量器。 ...2024-05-15 已阅读: n次