优化移植到Python的C算法

#include <stdio.h> #include <stdint.h> #include <time.h> int main(int argc, char** argv) { int buffer_length = 150; float sec = 0; float* buffer = malloc(sizeof(float)*buffer_length); clock_t before = clock(); int j; int16_t tau; int16_t i; float delta; for(j = 0; j < 90000; j++){ for(tau = 0 ; tau < 75; tau++){ for(i = 0; i < 75; i++){ delta = buffer[i] - buffer[i + tau]; buffer[tau] += delta * delta; } } } clock_t difference = clock() - before; sec = difference / (float )CLOCKS_PER_SEC; printf("%f\n",sec); return 0; }

import time buffer = [0.0]*150 ts = time.time() for j in range(90000): for tau in range(75): for i in range(75): delta = buffer[i] - buffer[i + tau] buffer[tau] += delta * delta print(time.time()-ts)

2条回答

网友

1楼 · 编辑于 2024-05-14 15:49:46

这看起来像是numba的工作。问题是python for循环比C循环慢得多。使用numba，您应该能够大大加快它们的速度，因为您自己编写了它们，并且没有外部依赖项（已知这些依赖项会干扰numba）

只需使用njit decorator并将嵌套for循环包装到函数中即可

网友

2楼 · 编辑于 2024-05-14 15:49:46

是的，Python在许多应用程序中都比C慢得多。那些需要大量数值计算的是一些最坏的情况。解决这些问题有多种方法

直接用C编写扩展是一种老派的方式，它可能对您特别有吸引力，因为您已经有了C代码。有一些工具可以帮助实现这一点，比如swig

或者，您可以使用Numpy很好地表达所需的计算。或者还有Cython，用于编写算法版本或包装算法的C实现

您要做的关键事情是避免在本机和Python数字表示之间进行转换。保持你所有的数字都是本地的

相关问题更多 >

编程相关推荐

热门问题

热门文章