如何获取附加在列表中的多个数据帧的mean、std和mad？

lst = [] for filen, filen1 in zip(filelistn, filelist1): df1 = pd.read_table(path_to_files+filen, skiprows=0, usecols=(0,1,2,3,4,8),names=['wave','num','stlines','fwhm','EWs','MeasredWave'],delimiter=r'\s+') df2 = pd.read_table(path_to_files1+filen1, skiprows=0, usecols=(0,1,2,3,4,8),names=['wave','num','stlines','fwhm','EWs','MeasredWave'],delimiter=r'\s+') dfs = pd.merge(df1,df2, on='wave', how='inner') dfs = df1 - df2 lst.append(dfs) df = reduce(lambda x, y: pd.merge(x, y, on = 'wave',how='outer'), lst) df = df.rename(columns = lambda x: x.split('_')[0]).T df = df.groupby(df.index).agg(['mean','std','mad','median']).T

wave mean median mad 0 4050.32 -0.016182 -0.011940 0.008885 1 4208.98 0.023707 0.007189 0.032585 2 4374.94 -0.001321 -0.001196 0.000378 3 4379.74 0.002778 0.003380 0.004685 4 6828.60 -10.604568 -0.000590 21.084799 5 6839.84 -0.003466 -0.001870 0.010169 6 6842.04 -32.751551 -0.002514 65.118329 7 6842.69 18.293519 -0.002158 36.385884

1条回答

网友

1楼 · 发布于 2024-06-17 15:23:56

您可以使用pandas.concat将数据帧序列连接到一个大数据帧中，然后像这样计算统计信息。你知道吗

import pandas as pd

# lst = [construct list of dataframes ...]
df = pd.concat(lst, axis=0)
means = df.mean()
stds = df.std()

编辑：如果您想获得按某个键分解的统计信息，例如wave，您可以使用以下命令。你知道吗

means = df.groupby('wave').mean()

相关问题更多 >

编程相关推荐

热门问题

热门文章