有效获取Pandas联合指数

from functools import reduce from itertools import repeat def add_dataframes(df1, df2): return df1.add(df2, fill_value=0) def sum_dataframes(dfs): return reduce(add_dataframes, dfs) def associate_tag(dfs, tag): return pd.concat((sum_dataframes(dfs).index, repeat(tag)), axis=1) def associate_tag(dfs, tag): s = sum_dataframes(dfs) return pd.DataFrame(list(zip(s.index, repeat(tag)))).set_index(0)

2条回答

网友

1楼 · 编辑于 2024-05-16 07:16:54

最后我发现pandas Index对象有一个__or__实现。在

希望以下版本的associate_tag可以避免多余的操作：

from operator import or_ as union
from itertools import repeat
from functools import reduce

def associate_tag(dfs, tag):   
    idx = reduce(union, (df.index for df in dfs))
    return pd.DataFrame(list(zip(idx, repeat(tag)))).set_index(0)

网友

2楼 · 编辑于 2024-05-16 07:16:54

根据您的意见，这里有一个修正的解决方案：

两部分：根据列名组合数据帧，可以帕金森病确保列名对齐后，您的整个数据帧列表。所以如果： dfA_1是：

       col1  col2
index            
idA_1     2     0
idA_2     1     0
idA_3     0     2

以及 dfA_2是：

^{pr2}$

那么

final = pd.concat([dfA_1,dfA_2])

final
       col1  col2  col3
index                  
idA_1     2     0   NaN
idA_2     1     0   NaN
idA_3     0     2   NaN
idA_1     3     2   1.0
idA_3     2     6   2.0
idA_4     4     0   2.0

用0填充这些nan：

final.fillna(0, inplace=True)

第2部分，标签：一旦您知道创建标记就像为索引定义映射一样简单，您可以编写一个简单的函数、硬编码dict或使用lambda：

final['tag'] = final.index.map(lambda x: x[2])

final
       col1  col2  col3 tag
index                      
idA_1     2     0   0.0   A
idA_2     1     0   0.0   A
idA_3     0     2   0.0   A
idA_1     3     2   1.0   A
idA_3     2     6   2.0   A
idA_4     4     0   2.0   A

相关问题更多 >

编程相关推荐

热门问题

热门文章