Python性能：嵌套列表上的迭代和操作

def f2(x,y,n,z): rows = [[0]*x for i in xrange(y)] for i in range(n): inputX, inputY = (int(x*random.random()), int(y*random.random())) topleft = (inputX - z, inputY - z) for i in xrange(max(0, topleft[0]), min(topleft[0]+(z*2), x)): l = max(0, topleft[1]) r = min(topleft[1]+(z*2), y) rows[i][l:r] = [j+(j<255) for j in rows[i][l:r]]

rows = [[0]*x for i in xrange(y)] def f3(x,y,n,z): inputs = [(int(x*random.random()), int(y*random.random())) for i in range(n)] rows = map(g, inputs) def g(input): inputX, inputY = input topleft = (inputX - 75, inputY - 75) for i in xrange(max(0, topleft[0]), min(topleft[0]+(75*2), 1024)): l = max(0, topleft[1]) r = min(topleft[1]+(75*2), 1024) rows[i][l:r] = [j+(j<255) for j in rows[i][l:r]]

def f(x,y,n,z): rows = [[0] * y for i in xrange(x)] rn = random.random for i in xrange(n): topleft = (int(x*rn()) - z, int(y*rn()) - z) l = max(0, topleft[1]) r = min(topleft[1]+(z*2), y) for u in xrange(max(0, topleft[0]), min(topleft[0]+(z*2), x)): rows[u][l:r] = [j+(j<255) for j in rows[u][l:r]]

def f3b(x,y,n,z): rn = random.random rows = [g1(x, y, z) for x, y in [(int(x*rn()), int(y*rn())) for i in xrange(n)]] def g1(x, y, z): l = y - z if y - z > 0 else 0 r = y + z if y + z < 1024 else 1024 for i in xrange(x - z if x - z > 0 else 0, x + z if x + z < 1024 else 1024 ): rows[i][l:r] = [j+(j<255) for j in rows[i][l:r]]

def f4(x,y,n,z): rows = [[0]*y for i in range(x)] rr = random.randrange inc = (1).__add__ sat = (0xff).__and__ for i in range(n): inputX, inputY = rr(x), rr(y) b = max(0, inputX - z) t = min(inputX + z, x) l = max(0, inputY - z) r = min(inputY + z, y) for i in range(b, t): rows[i][l:r] = map(inc, rows[i][l:r]) for i in range(x): rows[i] = map(sat, rows[i])

def timing(f,x,y,z,n): fn = "%s(%d,%d,%d,%d)" % (f.__name__, x, y, z, n) ctx = "from __main__ import %s" % f.__name__ results = timeit.Timer(fn, ctx).timeit(10) return "%4.4s: %.3f" % (f.__name__, results / 10.0) if __name__ == "__main__": print timing(f, 1024, 1024, 400, 75) #add more here.

3条回答

网友
1楼 · 编辑于 2024-04-25 04:28:22

在我（slow ish；-）第一天Macbook Air，1.6GHz Core 2 Duo，MacOSX 10.5上的系统Python2.5上，在op.py中保存代码后，我看到了以下计时：
$ python -mtimeit -s'import op' 'op.f1()' 10 loops, best of 3: 5.58 sec per loop $ python -mtimeit -s'import op' 'op.f2()' 10 loops, best of 3: 3.15 sec per loop
所以，我的机器比你的慢一点，比你的慢一点。在
我对这个任务最快的代码是：
^{pr2}$
乘以：
$ python -mtimeit -s'import op' 'op.f3()' 10 loops, best of 3: 3 sec per loop
所以，一个非常适度的加速，在你的机器上投射超过1.5秒-远高于你的目标1.0用于：-(. 在
使用简单的C代码扩展，exte.c…：
#include "Python.h" static PyObject* dopoint(PyObject* self, PyObject* args) { int x, y, z, px, py; int b, t, l, r; int i, j; PyObject* rows; if(!PyArg_ParseTuple(args, "iiiiiO", &x, &y, &z, &px, &py, &rows )) return 0; b = px - z; if (b < 0) b = 0; t = px + z; if (t > x) t = x; l = py - z; if (l < 0) l = 0; r = py + z; if (r > y) r = y; for(i = b; i < t; ++i) { PyObject* row = PyList_GetItem(rows, i); for(j = l; j < r; ++j) { PyObject* pyitem = PyList_GetItem(row, j); long item = PyInt_AsLong(pyitem); if (item < 255) { PyObject* newitem = PyInt_FromLong(item + 1); PyList_SetItem(row, j, newitem); } } } Py_RETURN_NONE; } static PyMethodDef exteMethods[] = { {"dopoint", dopoint, METH_VARARGS, "process a point"}, {0} }; void initexte() { Py_InitModule("exte", exteMethods); }
（注意：我没有仔细检查它——我认为由于引用窃取和借用的正确交互作用，它不会泄漏内存，但是在投入生产之前应该非常仔细地检查代码；—），我们可以这样做
import exte def f4(x=x,y=y,n=n,z=z): rows = [[0]*y for i in range(x)] rr = random.randrange for i in range(n): inputX, inputY = rr(x), rr(y) exte.dopoint(x, y, z, inputX, inputY, rows)
时间呢
$ python -mtimeit -s'import op' 'op.f4()' 10 loops, best of 3: 345 msec per loop
显示了8-9倍的加速度，这应该能让你达到你想要的水平。我看到一条评论说你不想要任何第三方扩展，但是，好吧，这个很小的扩展你可以完全自己做；-）。（（不确定什么授权条件适用于堆栈溢出时的代码，但如果需要，我很乐意在Apache2许可证或类似许可证下重新发布；-）。在

网友
2楼 · 编辑于 2024-04-25 04:28:22

1。一个（较小的）加速肯定是你的rows的初始化。。。在
更换
rows = [] for i in range(x): rows.append([0 for i in xrange(y)])
与
^{pr2}$
2。您还可以通过将random.random移出循环来避免一些查找（节省一点）。在
3.编辑：更正后，您可以得出如下结论：
def f(x,y,n,z): rows = [[0] * y for i in xrange(x)] rn = random.random for i in xrange(n): topleft = (int(x*rn()) - z, int(y*rn()) - z) l = max(0, topleft[1]) r = min(topleft[1]+(z*2), y) for u in xrange(max(0, topleft[0]), min(topleft[0]+(z*2), x)): rows[u][l:r] = [j+(j<255) for j in rows[u][l:r]]
编辑：timeit的一些新计时（10次跑步）--这似乎只提供了一些小的加速：
import timeit print timeit.Timer("f1(1024,1024,400,75)", "from __main__ import f1").timeit(10) print timeit.Timer("f2(1024,1024,400,75)", "from __main__ import f2").timeit(10) print timeit.Timer("f(1024,1024,400,75)", "from __main__ import f3").timeit(10)
f1 21.1669280529 f2 12.9376120567 f 11.1249599457

网友
3楼 · 编辑于 2024-04-25 04:28:22

在f3重写中，g可以简化。（也适用于f4）

在for循环中有以下代码。在

l = max(0, topleft[1])
r = min(topleft[1]+(75*2), 1024)

但是，在for循环中，这些值似乎永远不会更改。所以计算一次，在循环之外。在

相关问题更多 >

编程相关推荐

热门问题

热门文章