从稀疏矩阵的行创建稀疏对角矩阵

Question

我在Python/Scipy中处理比较大的矩阵。我需要从一个大矩阵（已经加载为coo_matrix）中提取行，并把它们用作对角线元素。目前我这样做：

import numpy as np
from scipy import sparse

def computation(A):
  for i in range(A.shape[0]):
    diag_elems = np.array(A[i,:].todense())
    ith_diag = sparse.spdiags(diag_elems,0,A.shape[1],A.shape[1], format = "csc")
    #...

#create some random matrix
A = (sparse.rand(1000,100000,0.02,format="csc")*5).astype(np.ubyte)
#get timings
profile.run('computation(A)')

从profile的输出中可以看到，大部分时间都花在了get_csr_submatrix函数上，用来提取diag_elems。这让我觉得我可能在使用稀疏数据的表示方式上不够高效，或者提取稀疏矩阵行的方法不对。你能建议一种更好的方法来从稀疏矩阵中提取行，并以对角线的形式表示吗？

编辑

以下的变体解决了行提取的瓶颈（注意，简单地把'csc'改成csr是不够的，A[i,:]也必须替换成A.getrow(i)）。不过主要的问题是如何省略物化（.todense()），并从行的稀疏表示中创建对角矩阵。

import numpy as np
from scipy import sparse

def computation(A):
  for i in range(A.shape[0]):
    diag_elems = np.array(A.getrow(i).todense())
    ith_diag = sparse.spdiags(diag_elems,0,A.shape[1],A.shape[1], format = "csc")
    #...

#create some random matrix
A = (sparse.rand(1000,100000,0.02,format="csr")*5).astype(np.ubyte)
#get timings
profile.run('computation(A)')

如果我直接从一个1行的CSR矩阵创建对角矩阵，如下所示：

diag_elems = A.getrow(i)
ith_diag = sparse.spdiags(diag_elems,0,A.shape[1],A.shape[1])

那么我既不能指定format="csc"参数，也不能把ith_diags转换成CSC格式：

Traceback (most recent call last):
   File "<stdin>", line 1, in <module>
  File "/usr/local/lib/python2.6/profile.py", line 70, in run
    prof = prof.run(statement)
  File "/usr/local/lib/python2.6/profile.py", line 456, in run
    return self.runctx(cmd, dict, dict)
  File "/usr/local/lib/python2.6/profile.py", line 462, in runctx
    exec cmd in globals, locals
  File "<string>", line 1, in <module>
  File "<stdin>", line 4, in computation
  File "/usr/local/lib/python2.6/site-packages/scipy/sparse/construct.py", line 56, in spdiags
    return dia_matrix((data, diags), shape=(m,n)).asformat(format)
  File "/usr/local/lib/python2.6/site-packages/scipy/sparse/base.py", line 211, in asformat
    return getattr(self,'to' + format)()
  File "/usr/local/lib/python2.6/site-packages/scipy/sparse/dia.py", line 173, in tocsc
    return self.tocoo().tocsc()
  File "/usr/local/lib/python2.6/site-packages/scipy/sparse/coo.py", line 263, in tocsc
    data    = np.empty(self.nnz, dtype=upcast(self.dtype))
  File "/usr/local/lib/python2.6/site-packages/scipy/sparse/sputils.py", line 47, in upcast
    raise TypeError,'no supported conversion for types: %s' % args
TypeError: no supported conversion for types: object`

矩阵运算稀疏矩阵对角矩阵行提取稀疏数据 csr矩阵 coo_matrix csc格式

从稀疏矩阵的行创建稀疏对角矩阵

1 个回答

撰写回答