在不同条件下向Dataframe添加列

data['total'] = data.a + data.b + data.c data a b c rate total 1 1 0 0 0.10 1 2 0 1 0 0.11 1 3 0 0 1 0.12 1 4 1 1 0 0.24 2 5 1 0 1 0.27 2 6 0 1 1 0.30 2 7 1 1 1 0.40 3

# Channel a alone occurs (ABC => 100) prob_a = data['rate'][(data.a == 1) & (data.total == 1)] # Channel b alone occurs (ABC => 010) prob_b = data['rate'][(data.b == 1) & (data.total == 1)] # Channel c alone occurs (ABC => 001) prob_c = data['rate'][(data.c == 1) & (data.total == 1)]

reduced['prob_a'] = data['rate'][(data.a == 1) & (data.total == 1)] reduced['prob_b'] = data['rate'][(data.b == 1) & (data.total == 1)] reduced['prob_c'] = data['rate'][(data.c == 1) & (data.total == 1)] print(reduced)

2条回答

网友

1楼 · 编辑于 2024-05-14 03:09:05

把它分成两步

一个计算概率

probs = data.query('a + b + c == 1').pipe(
    lambda d: d.drop('rate', 1).T.dot(d.rate)
)

probs

a    0.10
b    0.11
c    0.12
dtype: float64

工作原理总行数等于一行：

data.query('a + b + c == 1')

   a  b  c  rate
1  1  0  0  0.10
2  0  1  0  0.11
3  0  0  1  0.12

pipe允许我们将结果管道化到函数中。根据上面的结果，我想将列a、b、c与列rate进行点积。通过pipe的lambda允许我这样做。你知道吗

更广泛的方法

df = data.copy()
rate = df.pop('rate')
mask = df.sum(1) == 1
probs = df[mask].T.dot(rate[mask])

probs

两个
剩下的

data.join(
    data.drop('rate', 1).mul(probs).add_prefix('prob_')
).query('a + b + c == 2 and a == 1')

   a  b  c  rate  prob_a  prob_b  prob_c
4  1  1  0  0.24     0.1    0.11    0.00
5  1  0  1  0.27     0.1    0.00    0.12

网友

2楼 · 编辑于 2024-05-14 03:09:05

IIUC公司

reduced['prob_a'] = data.loc[(data.a == 1) & (data.total == 1),'rate'].values[0]
reduced['prob_b'] = data.loc[(data.b == 1) & (data.total == 1),'rate'].values[0]
reduced['prob_c'] = data.loc[(data.c == 1) & (data.total == 1),'rate'].values[0]

reduced[['prob_a','prob_b','prob_c']]=reduced[['prob_a','prob_b','prob_c']].mul(reduced[['a','b','c']].eq(1).values)
reduced
Out[698]: 
   a  b  c  rate  total  prob_a  prob_b  prob_c
4  1  1  0  0.24      2     0.1    0.11    0.00
5  1  0  1  0.27      2     0.1    0.00    0.12

相关问题更多 >

编程相关推荐

热门问题

热门文章