为什么Pandas数据帧功能在一台机器上比在另一台机器上花费更长的时间

2024-04-28 16:35:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我们一直在运行一个应用程序,该应用程序利用了DigitalOcean上的pandas库,该库具有4个CPU8 GB RAM。在迁移到GCP的过程中,我在计算引擎上托管了相同的应用程序,并分配了2个CPU和4 GB的RAM

在监控应用程序时,特别是使用pandas dataframe的一个功能,我注意到该功能在GCE上花费的时间超过了5小时,而在DigitalOcean上,同样的功能花费的时间少于7分钟

我使用top命令监视该特定进程的资源使用情况,没有注意到任何差异。然后,我使用strace-c开关来计算两台机器上每个系统调用的时间、调用和错误,从程序开始到结束,但仍然没有发现完成syscalls所需的总时间有很大差异。是的,在wait4系统调用中存在差异;在GCE上,它有5次呼叫,有4次错误,而在DigitalOcean上,它只有一次呼叫,没有错误

<> P>还有什么要考虑的?我怎么知道为什么在一台机器上花费更少的时间而在另一台机器上花费更多的时间


Tags: 功能机器应用程序利用pandas系统错误时间