一个偏微分方程积分的Cythonize

def laplacian(var, dh2): """ (1D array, dx^2) -> laplacian(1D array) periodic_laplacian_1D_4th_order Implementing the 4th order 1D laplacian with periodic condition """ lap = numpy.zeros_like(var) lap[1:] = (4.0/3.0)*var[:-1] lap[0] = (4.0/3.0)*var[1] lap[:-1] += (4.0/3.0)*var[1:] lap[-1] += (4.0/3.0)*var[0] lap += (-5.0/2.0)*var lap[2:] += (-1.0/12.0)*var[:-2] lap[:2] += (-1.0/12.0)*var[-2:] lap[:-2] += (-1.0/12.0)*var[2:] lap[-2:] += (-1.0/12.0)*var[:2] return lap / dh2

2条回答

网友

1楼 · 编辑于 2024-05-14 17:34:17

所以我想我已经想好了，虽然我不确定这是最好的方法：

import numpy as np
cimport numpy as np
cdef laplacian(np.ndarray[np.float64_t, ndim=1] var,np.float64_t dh2):
    """ (1D array, dx^2) -> laplacian(1D array)
    periodic_laplacian_1D_4th_order
    Implementing the 4th order 1D laplacian with periodic condition
    """
    lap = np.zeros_like(var)
    lap[1:]    = (4.0/3.0)*var[:-1]
    lap[0]     = (4.0/3.0)*var[1]
    lap[:-1]  += (4.0/3.0)*var[1:]
    lap[-1]   += (4.0/3.0)*var[0]
    lap       += (-5.0/2.0)*var

    lap[2:]   += (-1.0/12.0)*var[:-2]
    lap[:2]   += (-1.0/12.0)*var[-2:]
    lap[:-2]  += (-1.0/12.0)*var[2:]
    lap[-2:]  += (-1.0/12.0)*var[:2]

    return lap / dh2

我用了以下方法设置.py在

^{pr2}$

欢迎提出任何改进建议。。在

网友

2楼 · 编辑于 2024-05-14 17:34:17

要有效地使用Cython，应该使所有循环显式化，并确保cython -a显示尽可能少的Python调用。第一次尝试是：

import numpy as np
cimport numpy as np
cimport cython
@cython.boundscheck(False)
@cython.wraparound(False)
@cython.cdivision(True)
def laplacian(double [::1] var, double dh2):
    """ (1D array, dx^2) -> laplacian(1D array)
    periodic_laplacian_1D_4th_order
    Implementing the 4th order 1D laplacian with periodic condition
    """
    cdef int n = var.shape[0]
    cdef double[::1] lap = np.zeros(n)
    cdef int i
    for i in range(0, n-1):
        lap[1+i] = (4.0/3.0)*var[i]
    lap[0]     = (4.0/3.0)*var[1]
    for i in range(0, n-1):
        lap[i]  += (4.0/3.0)*var[1+i]
    lap[n-1]   += (4.0/3.0)*var[0]
    for i in range(0, n):
        lap[i]       += (-5.0/2.0)*var[i]

    for i in range(0, n-2):
        lap[2+i]   += (-1.0/12.0)*var[i]
    for i in range(0, 2):
        lap[i]   += (-1.0/12.0)*var[n - 2 + i]
    for i in range(0, n-2):
        lap[i]   += (-1.0/12.0)*var[i+2]
    for i in range(0, 2):
        lap[n-2+i]  += (-1.0/12.0)*var[i]
    for i in range(0, n):
        lap[i]  /= dh2
    return lap

现在你可以：

^{pr2}$

而纽比密码给出了：

100 loops, best of 3: 18.5 msec per loop

注意，Cython可以通过合并循环等进一步优化

我还尝试了Pythran的自定义（即未在主版本中提交），并且在不更改原始Python代码的情况下，我获得了与Cython版本相同的加速，而无需转换代码：

#pythran export laplacian(float [], float)
import numpy
def laplacian(var, dh2):
    """ (1D array, dx^2) -> laplacian(1D array)
    periodic_laplacian_1D_4th_order
    Implementing the 4th order 1D laplacian with periodic condition
    """
    lap = numpy.zeros_like(var)
    lap[1:]    = (4.0/3.0)*var[:-1]
    lap[0]     = (4.0/3.0)*var[1]
    lap[:-1]  += (4.0/3.0)*var[1:]
    lap[-1]   += (4.0/3.0)*var[0]
    lap       += (-5.0/2.0)*var

    lap[2:]   += (-1.0/12.0)*var[:-2]
    lap[:2]   += (-1.0/12.0)*var[-2:]
    lap[:-2]  += (-1.0/12.0)*var[2:]
    lap[-2:]  += (-1.0/12.0)*var[:2]

    return lap / dh2

转换为：

$ pythran lap.py -O3

我得到：

100 loops, best of 3: 11.6 msec per loop

相关问题更多 >

编程相关推荐

热门问题

热门文章