擅长:python、mysql、java
<p>我自己找到了解决办法。逻辑是首先将所有值标准化,将其除以序列长度(#个记录),然后使用默认值<code>df.mean()</code>,然后将标准化的平均值乘以#个记录:这是一个从1分37秒到3.13秒的改进。但是我仍然不明白为什么熊猫实现没有使用这样的优化。你知道吗</p>
<pre><code>def mean_without_overflow_fast(col):
col /= len(col)
return col.mean() * len(col)
</code></pre>
<p>按如下方式使用此功能:</p>
<pre><code>print (df.apply(mean_without_overflow_fast))
</code></pre>