我如何在Pandas中运行一个更有效的程序

2024-03-29 15:00:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个非常耗时的程序,使用熊猫。幸运的是,它只是吐出信息,不会影响任何用户体验。也就是说,一直调试和重新运行是一件非常痛苦的事情

我知道嵌套for循环可能会导致大部分性能下降,但这是不可避免的,因为我需要所有可能的排列。我要找的是任何其他的方法来挤压出一些更好的表现出我的程序。例如,有没有更有效的pandas/datframe习惯用法可以替代

程序如下所示:

dict = {} 
   for w_id in range(1,6):
        for x_id in range(1,26):
            for y_id in range(1,12):
                for z_id in range(1,6):


                    #create a query based on id's and assign it to, lets say df1
                    #assign a special combo of id's as df1's index
                    dict[row_id] = df

df_foo = pd.concat(dict)

df_foo = df_foo.groupby(level = 0).describe().to_csv


Tags: to用户in程序信息iddffor