我建立了一个神经网络,它需要使用Cholesky分解和求解三角系统作为其计算的一部分。当然,这意味着我还需要计算整个计算的梯度。在
当我试图编译代码时,我得到了一个错误“No Cula available”。不幸的是,我无法从website下载Cula。在
我想知道是否可以将CPU和GPU和NO混合使用。我需要使用Cholesky来求解的矩阵很小(100x100),所以我可以在CPU上完成这部分工作。不过,要做到这一点,我需要在GPU计算完矩阵之后立即将其传输到CPU,然后将结果发送回GPU。有没有可能做到足够透明?在
Tags:
这种转移是透明的。不需要做什么特别的事。但我建议您对Theano图进行分析,以确定:http://deeplearning.net/software/theano/tutorial/profiling.html#tut-profiling
对于库拉,有一个公关,提供了一个解决方案的基础上,现在由英伟达提供。所以这可能不再需要了。试试这个PR:https://github.com/Theano/Theano/pull/4917
相关问题 更多 >
编程相关推荐