对pandas数据框中的每一列应用函数

def calculate_df_columns_mean(self, df): means = {} for column in df.columns.columns.tolist(): cleaned_data = self.remove_outliers(df[column].tolist()) means[column] = np.mean(cleaned_data) return means

2条回答

网友

1楼 · 编辑于 2024-05-14 22:17:30

在我看来，对列的迭代是不必要的：

def calculate_df_columns_mean(self, df):
    cleaned_data = self.remove_outliers(df[column].tolist())
    return cleaned_data.mean()

假设remove_outliers仍然返回一个df，上面的内容就足够了

编辑

我认为以下几点应该管用：

def calculate_df_columns_mean(self, df):
    return df.apply(lambda x: remove_outliers(x.tolist()).mean()

网友

2楼 · 编辑于 2024-05-14 22:17:30

使用^{}：

# axis=0 means apply to columns; axis=1 to rows
df.apply(numpy.sum, axis=0) # equiv to df.sum(0)

编程相关推荐

java将Scanner对象作为构造函数参数传递给UserInterface类
spring未能启动bean“subtocolWebSocketHandler”；嵌套的例外是java。lang.IllegalArgumentException:没有处理程序
Java EE应用程序中后台服务的多线程Java线程（设置守护进程和优先级）？
java Pull to refresh返回列表的第一个位置
无法将comparator类转换为java。可比的
java将json从servlet传递到dojo
JavaHibernate：将子类实例转换为超类实例
java警告调用servlet类时非法反射访问
java静态变量值
java@Entity和@embeddeble之间有什么区别

相关问题更多 >

编程相关推荐

热门问题

热门文章

对pandas数据框中的每一列应用函数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >