如何定义自定义函数以在pydatatable中生成摘要统计信息?

2024-05-16 13:24:43 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试构建一个自定义函数,以生成给定字段的摘要统计信息,如代码片段所示

def estadistica_dt_summario(dt,col,por):
    dt_summary= dt[{'mean_of_specific_col':mean(col),'median_of_specific_col':median(col)},by(por)]
    return dt_summary

其中:

  • dt-数据表框架对象
  • col-要计算的字段(平均值、中值等)
  • por-要聚合的字段

这里我调用函数

estadistica_dt_summario(comida_dt,"co2_emission","food_category")

它没有按预期工作,您的任何人都可以让我知道如何以pydatatable的方式实现它吗


Tags: of函数代码信息bydefdtcol
1条回答
网友
1楼 · 发布于 2024-05-16 13:24:43

您可以尝试以下方法:

def estadistica_dt_summario(DT, col, por):
    dt_summary = DT[{'mean_of_specific_col': mean(f[col]),
                     'median_of_specific_col': median(f[col])},
                    by(f[por])]
    return dt_summary

当您将字段传递给函数时,请记住使用f表达式

相关问题 更多 >