Pandas在循环中复制多个列

2024-04-16 05:29:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据帧df,有4列,a、B、C和D

我想把这些列的每一个组合都加上。在

到目前为止我有

columns=[A,B,C,D]

a= combinations(columns)

for i in a:
    df[outname]=df[a].multiply()

但显然这是不对的。在

有谁能找到好办法吗?在

输出:

^{pr2}$

Tags: columns数据indfformultiply办法pr2
3条回答

使用this中的函数查找所有组合,并在列表理解中创建所有值的乘积:

df = pd.DataFrame({
         'A':[5,3,6,9,2,4],
         'B':[4,5,4,5,5,4],
         'C':[7,8,9,4,2,3],
         'D':[1,3,5,7,1,0],

})

from itertools import chain, combinations
def all_subsets(ss):
    return chain(*map(lambda x: combinations(ss, x), range(1, len(ss)+1)))

#get all combination
tups = list(all_subsets(df.columns))
#for each combination multiple values
df1 = pd.concat([df.loc[:,c].product(axis=1) for c in tups], axis=1)
#set new columns by join list of tuples tups
df1.columns = [''.join(x) for x in tups]
print (df1)
   A  B  C  D  AB  AC  AD  BC  BD  CD  ABC  ABD  ACD  BCD  ABCD
0  5  4  7  1  20  35   5  28   4   7  140   20   35   28   140
1  3  5  8  3  15  24   9  40  15  24  120   45   72  120   360
2  6  4  9  5  24  54  30  36  20  45  216  120  270  180  1080
3  9  5  4  7  45  36  63  20  35  28  180  315  252  140  1260
4  2  5  2  1  10   4   2  10   5   2   20   10    4   10    20
5  4  4  3  0  16  12   0  12   0   0   48    0    0    0     0

您可以生成不同大小的组合列表。在

import itertools
l=[] # final list
ll = list('ABCD') # list of letters
for L in range(0, len(ll)+1):
    for subset in itertools.combinations(ll, L):
        l.append(''.join(subset))
del(l[0]) # remove the empty string ''               
print(l)

^{pr2}$

您可以这样使用数据帧:

df = pd.DataFrame({
         'A':[5,3,6,9,2,4],
         'B':[4,5,4,5,5,4],
         'C':[7,8,9,4,2,3],
         'D':[1,3,5,7,1,0],

})

然后您可以使用以下代码:

l=['A', 'B', 'C', 'D', 'AB', 'AC', 'AD', 'BC', 'BD', 'CD', 'ABC', 'ABD', 'ACD', 'BCD', 'ABCD']

for i in l:
    if(len(i)>1):
        df[i]=1 # set the initial value to 1

for i in l:
    if(len(i)>1):
        plets=list(i)
        for p in plets:
            df[i]*=df[p] #makes the product based on columns name disolver
print(df)        

   A  B  C  D  AB  AC  AD  BC  BD  CD  ABC  ABD  ACD  BCD  ABCD
0  5  4  7  1  20  35   5  28   4   7  140   20   35   28   140
1  3  5  8  3  15  24   9  40  15  24  120   45   72  120   360
2  6  4  9  5  24  54  30  36  20  45  216  120  270  180  1080
3  9  5  4  7  45  36  63  20  35  28  180  315  252  140  1260
4  2  5  2  1  10   4   2  10   5   2   20   10    4   10    20
5  4  4  3  0  16  12   0  12   0   0   48    0    0    0     0

使用:

import itertools
L=[(x, y) for x, y in itertools.product(df.columns,df.columns) if x != y]
pd.concat([pd.DataFrame({''.join(i):df.loc[:,i].prod(axis=1)}) for i in L],axis=1)

^{pr2}$

相关问题 更多 >