假设A是一个具有tf-idf值的(scipy
)稀疏矩阵,B是一个具有我的数据的一些附加特性的(numpy
)数组
A
和B
的每一行对应于相同的观察结果
我想连接这些矩阵/数组,因为我想把它们传递给skl模型来训练它,我不认为我可以分别传递它们
根据这个答案(https://stackoverflow.com/a/49420566/9024698),有两种方法连接这些数组:
A
)转换为密集数组,然后连接B
)转换为稀疏矩阵然而,(1)在我的例子中基本上是不可能的,因为在我的例子中A
太大了
因此,我可以考虑将完全密集数组(B
)转换为稀疏数组
但是,我的问题是,这样做是否会丢失任何信息(即,将完全密集的数组转换为稀疏数组)
这篇文章(How to combine TFIDF features with other features)与我的文章相关,但它没有明确回答我的问题
不,你不会丢失任何信息。在这种情况下,稀疏/密集是相同数据的两种不同表示形式。详见https://machinelearningmastery.com/sparse-matrices-for-machine-learning/
相关问题 更多 >
编程相关推荐