Python 函数调用真的很慢

11 投票
1 回答
19699 浏览
提问于 2025-04-17 14:26

这段话主要是想确认我的方法是否正确,但我基本的问题是,检查一下在调用一个函数之前,是否真的需要访问这个函数,值不值得。我知道,有人会说这是过早优化,但在很多情况下,这决定了我是在函数内部放一个if语句来判断是否需要执行后面的代码,还是在函数调用之前就判断。换句话说,这两种做法其实都不费劲。目前,我的检查混合在两者之间,我想把它们整理得更规范一些。

我问这个问题的主要原因是,因为我看到的其他回答大多提到了timeit这个工具,但我用它时得到了负数,所以我换成了这个:

import timeit
import cProfile

def aaaa(idd):
    return idd

def main():
    #start = timeit.timeit()
    for i in range(9999999):
        a = 5
    #end = timeit.timeit()
    #print("1", end - start)

def main2():
    #start = timeit.timeit()
    for i in range(9999999):
        aaaa(5)
    #end = timeit.timeit()
    #print("2", end - start)

cProfile.run('main()', sort='cumulative')
cProfile.run('main2()', sort='cumulative')

然后得到了这个输出:

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.310    0.310 {built-in method exec}
        1    0.000    0.000    0.310    0.310 <string>:1(<module>)
        1    0.310    0.310    0.310    0.310 test.py:7(main)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    2.044    2.044 {built-in method exec}
        1    0.000    0.000    2.044    2.044 <string>:1(<module>)
        1    1.522    1.522    2.044    2.044 test.py:14(main2)
  9999999    0.521    0.000    0.521    0.000 test.py:4(aaaa)

对我来说,这显示出不调用这个函数的时间是0.31秒,而调用它的时间是1.52秒,几乎慢了5倍。但正如我所说,我在使用timeit时得到了负数,所以我想确认一下,确实是这么慢。

另外,从我了解到的情况来看,函数调用之所以慢,是因为Python需要先确认这个函数是否还存在,才能运行它。难道没有办法让它假设所有东西都还在,这样就不需要做那些显得多余的工作,而这些工作显然会让它慢5倍吗?

1 个回答

43

你在比较苹果和橙子。一个方法只是简单地赋值,另一个则是调用一个函数。没错,函数调用确实会增加一些额外的时间开销。

你应该把这个过程简化到最基本的部分来使用 timeit

>>> import timeit
>>> timeit.timeit('a = 5')
0.03456282615661621
>>> timeit.timeit('foo()', 'def foo(): a = 5')
0.14389896392822266

现在我们做的只是 添加 了一个函数调用(foo 也做同样的事情),这样你就可以测量函数调用所需的额外时间。你不能说这几乎慢了4倍,不,函数调用 增加 了0.11秒的开销,针对 1.000.000 次迭代。

如果我们把 a = 5 换成一个需要0.5秒来执行一百万次迭代的操作,把它放到一个函数里并不会让时间变成2秒。现在只会变成0.61秒,因为函数的开销并不会增加。

函数调用需要处理栈,先把局部变量的框架推入栈中,创建一个新的框架,然后在函数返回时再清理这些内容。

换句话说,把语句放到一个函数里会增加一点开销,而你放入函数的语句越多,这个开销在总工作量中所占的比例就越小。函数 绝不会 让这些语句本身变得更慢。

在Python中,函数其实就是存储在变量中的一个对象;你可以把函数赋值给另一个变量,或者随时用完全不同的东西替换它,甚至删除它。当你调用一个函数时,首先要引用存储它的名字(foo),然后调用这个函数对象((arguments));在动态语言中,这个查找每次都必须进行。

你可以在为一个函数生成的字节码中看到这一点:

>>> def foo():
...     pass
... 
>>> def bar():
...     return foo()
... 
>>> import dis
>>> dis.dis(bar)
  2           0 LOAD_GLOBAL              0 (foo)
              3 CALL_FUNCTION            0
              6 RETURN_VALUE        

LOAD_GLOBAL 操作码会在全局命名空间中查找名字(foo),基本上就是在哈希表中查找,然后把结果推入栈中。CALL_FUNCTION 然后调用栈中的内容,用返回值替换它。RETURN_VALUE 从函数调用中返回,再次取出栈顶的内容作为返回值。

撰写回答