我试图找出在2dnumpy数组中为每个单元并行执行单个操作的最佳方法。在
特别是,我需要对数组中的每个单元执行位操作。在
这是我使用单个for
循环所做的:
for x in range(M):
for y in range(N):
v[x][y] = (v[x][y] >> 7) & 255
我找到了一种方法,使用vectorize
方法来完成上述操作:
然而,使用向量化似乎并不能提高性能。在
我在this answer on StackOverflow上读到了numexpr,其中也引用了Theano和Cython。尤其是no似乎是一个很好的解决方案,但是我找不到适合我的例子。在
所以我的问题是:使用并行化和可能的GPU计算,哪一个是改进上述代码的最佳方法?有人可以发布一些示例代码吗?在
我不熟悉按位操作,但这里给出的结果与您的代码相同,并且是矢量化的。在
相关问题 更多 >
编程相关推荐