将完全密集的数组转换为稀疏矩阵是否会丢失任何信息?

2024-05-15 08:23:50 发布

您现在位置:Python中文网/ 问答频道 /正文

假设A是一个具有tf-idf值的(scipy)稀疏矩阵,B是一个具有我的数据的一些附加特性的(numpy)数组

AB的每一行对应于相同的观察结果

我想连接这些矩阵/数组,因为我想把它们传递给skl模型来训练它,我不认为我可以分别传递它们

根据这个答案(https://stackoverflow.com/a/49420566/9024698),有两种方法连接这些数组:

  1. 将稀疏数组(A)转换为密集数组,然后连接
  2. 将全密集数组(B)转换为稀疏矩阵

然而,(1)在我的例子中基本上是不可能的,因为在我的例子中A太大了

因此,我可以考虑将完全密集数组(B)转换为稀疏数组

但是,我的问题是,这样做是否会丢失任何信息(即,将完全密集的数组转换为稀疏数组)

这篇文章(How to combine TFIDF features with other features)与我的文章相关,但它没有明确回答我的问题


Tags: 数据答案https模型numpytf矩阵scipy