我正在尝试将我的程序转换为Numba,但在将一个函数嵌套到另一个函数中时遇到了一个问题。我的方法基于NumPy vectorize
,但是我不能用numba做同样的事情。你知道我能举出什么类似的例子吗?在
这是我的节目:
import numpy as np
import scipy
import functools
from multiprocessing import Pool
import lib as mlib
from tqdm import tqdm
class vectorize(np.vectorize):
def __get__(self, obj, objtype):
return functools.partial(self.__call__, obj)
class stability:
def __init__(self):
self.r1 = 20
self.r2 = 50
self.rz= 20
self.zeta = self.r2/self.r1
self.beta = self.rz/self.r1
self.Ms = 0.956e6
self.delta = 1
@vectorize
def f(self,ro,rs):
# print("delta=",self.delta)
return rs/ro*np.exp( (-1/self.delta)*(ro-rs))
@vectorize
def mz(self,ro,rs):
return ( 1-self.f(ro,rs)**2 ) / ( 1+self.f(ro,rs)**2 )
@vectorize
def mro(self,ro,rs):
return ( 2*self.f(ro,rs) ) / ( 1+self.f(ro,rs)**2 )
@vectorize
def E1m(self,a, b, N,rs,d):
r = np.linspace(a+(b-a)/(2*N), b-(b-a)/(2*N), N)
fx = r* ((1/self.delta+1/r)**2 * self.mro(r,rs)**2 + (1/r**2 + 1)*self.mro(r,rs)**2+d*(-(1/self.delta + 1/r) * self.mro(r,rs) + 1/r * self.mro(r,rs)*self.mz(r,rs) ))
area = np.sum(fx)*(b-a)/N
return area
if __name__ == "__main__":
rs = np.arange(0,100,1)
model = stability()
print(model.E1m(0,20,300,rs,2))
大多数内置的NumPy函数都已经向量化了,根本不需要
np.vectorize
修饰符。通常,numpy.vectorize
修饰符将产生非常慢的结果(与NumPy相比)!作为documentation mentions in the Notes section:通过从}中删除装饰符,可以极大地提高代码效率。它将给出相同的结果,但运行得更快(您的代码10.4秒,更改代码0.014秒)。在
f
、mz
、和{通过使用广播而不是
vectorize
,还可以改进E1m
函数(就性能而言)。在但是,由于您的问题是关于如何在这些函数上使用
numba.vectorize
,我有一些坏消息:在实例方法上使用numba.vectorize
是不可能的,因为numba需要类型信息,而这些信息对于定制的Python类不可用。在一般来说,numba最好从NumPy数组上的纯循环代码开始(无矢量化),然后使用numba
njit
修饰符(或jit(nopython=True)
)。这对方法也不起作用,但是传递标量参数和只迭代所需的数组要容易得多。在但是,如果您真的想使用
vectorize
方法,那么您应该如何使用f
:self
,您不能使用实例方法,因此您需要一个静态方法或一个独立的函数。因为您没有访问self
的权限,所以您需要传入delta
或使其全局化。我决定把它作为一个论据:- 然后你需要找出你的参数是什么类型(或者你想支持什么类型),以及为签名返回什么。您的ro是一个整数数组,rs是一个浮点数组,delta是一个整数,因此签名如下(语法是
^{pr2}$return_type(argument_1_type, argument_2_type, ....)
):基本上就是这样。在
对于
mz
和mro
,您也可以这样做(记住,您还需要delta
):转换
E1m
函数似乎有点棘手(我没有尝试过),我把它留给读者作为练习。在如果您感兴趣的话,我将如何解决没有
vectorize
:可能还有一点可以通过循环提升或更聪明的计算方法来优化,但在我的电脑上,它已经相当快了:大约100微秒,比上面的14毫秒快了100倍。在
谢谢你!现在我有40倍更快的解决方案。在
相关问题 更多 >
编程相关推荐