Python 函数调用真的很慢
这段话主要是想确认我的方法是否正确,但我基本的问题是,检查一下在调用一个函数之前,是否真的需要访问这个函数,值不值得。我知道,有人会说这是过早优化,但在很多情况下,这决定了我是在函数内部放一个if语句来判断是否需要执行后面的代码,还是在函数调用之前就判断。换句话说,这两种做法其实都不费劲。目前,我的检查混合在两者之间,我想把它们整理得更规范一些。
我问这个问题的主要原因是,因为我看到的其他回答大多提到了timeit这个工具,但我用它时得到了负数,所以我换成了这个:
import timeit
import cProfile
def aaaa(idd):
return idd
def main():
#start = timeit.timeit()
for i in range(9999999):
a = 5
#end = timeit.timeit()
#print("1", end - start)
def main2():
#start = timeit.timeit()
for i in range(9999999):
aaaa(5)
#end = timeit.timeit()
#print("2", end - start)
cProfile.run('main()', sort='cumulative')
cProfile.run('main2()', sort='cumulative')
然后得到了这个输出:
ncalls tottime percall cumtime percall filename:lineno(function)
1 0.000 0.000 0.310 0.310 {built-in method exec}
1 0.000 0.000 0.310 0.310 <string>:1(<module>)
1 0.310 0.310 0.310 0.310 test.py:7(main)
1 0.000 0.000 0.000 0.000 {method 'disable' of '_lsprof.Profiler' objects}
ncalls tottime percall cumtime percall filename:lineno(function)
1 0.000 0.000 2.044 2.044 {built-in method exec}
1 0.000 0.000 2.044 2.044 <string>:1(<module>)
1 1.522 1.522 2.044 2.044 test.py:14(main2)
9999999 0.521 0.000 0.521 0.000 test.py:4(aaaa)
对我来说,这显示出不调用这个函数的时间是0.31秒,而调用它的时间是1.52秒,几乎慢了5倍。但正如我所说,我在使用timeit时得到了负数,所以我想确认一下,确实是这么慢。
另外,从我了解到的情况来看,函数调用之所以慢,是因为Python需要先确认这个函数是否还存在,才能运行它。难道没有办法让它假设所有东西都还在,这样就不需要做那些显得多余的工作,而这些工作显然会让它慢5倍吗?
1 个回答
你在比较苹果和橙子。一个方法只是简单地赋值,另一个则是调用一个函数。没错,函数调用确实会增加一些额外的时间开销。
你应该把这个过程简化到最基本的部分来使用 timeit
:
>>> import timeit
>>> timeit.timeit('a = 5')
0.03456282615661621
>>> timeit.timeit('foo()', 'def foo(): a = 5')
0.14389896392822266
现在我们做的只是 添加 了一个函数调用(foo
也做同样的事情),这样你就可以测量函数调用所需的额外时间。你不能说这几乎慢了4倍,不,函数调用 增加 了0.11秒的开销,针对 1.000.000 次迭代。
如果我们把 a = 5
换成一个需要0.5秒来执行一百万次迭代的操作,把它放到一个函数里并不会让时间变成2秒。现在只会变成0.61秒,因为函数的开销并不会增加。
函数调用需要处理栈,先把局部变量的框架推入栈中,创建一个新的框架,然后在函数返回时再清理这些内容。
换句话说,把语句放到一个函数里会增加一点开销,而你放入函数的语句越多,这个开销在总工作量中所占的比例就越小。函数 绝不会 让这些语句本身变得更慢。
在Python中,函数其实就是存储在变量中的一个对象;你可以把函数赋值给另一个变量,或者随时用完全不同的东西替换它,甚至删除它。当你调用一个函数时,首先要引用存储它的名字(foo
),然后调用这个函数对象((arguments)
);在动态语言中,这个查找每次都必须进行。
你可以在为一个函数生成的字节码中看到这一点:
>>> def foo():
... pass
...
>>> def bar():
... return foo()
...
>>> import dis
>>> dis.dis(bar)
2 0 LOAD_GLOBAL 0 (foo)
3 CALL_FUNCTION 0
6 RETURN_VALUE
LOAD_GLOBAL
操作码会在全局命名空间中查找名字(foo
),基本上就是在哈希表中查找,然后把结果推入栈中。CALL_FUNCTION
然后调用栈中的内容,用返回值替换它。RETURN_VALUE
从函数调用中返回,再次取出栈顶的内容作为返回值。