Pandas通过在两个不同的dataframes/Pandas中选择多个列来创建条件列

+-------+----------------- |coil_id|sample_factor|SEQ +-------+----------------- |E101634|10.4066 | 1 |E101634|20.8132 | 2 |E101634|31.2198 | 3 |E101634|41.6264 | 4 |E101634|5220.033 |449

def new_gauge : for row in df1('sample_factor'): if df1['sample_factor'] > df2['sample'] and df1['sample_factor'] < df2['sample'] + 1: return df2['gauge']+(((df2['gauge']+1)-df2['gauge'])/10)*(df1['sample_factor']-df2['sample'])) df1['new_gauge'] = df1.apply(new_gauge)

1条回答

网友
1楼 · 发布于 2024-04-18 07:01:52

下面是与预期输出匹配的起始示例数据
df1
coil_id sample_factor SEQ 0 E101634 10.4066 1 1 E101634 20.8132 2 2 E101634 31.2198 3 3 E101634 41.6264 4 4 E101634 52.0330 5 5 E101634 62.4396 6 6 E101634 5220.0330 449
df2
coil_id SAMPLE GAUGE 0 E101634 10 0.0550 1 E101634 20 0.0568 2 E101634 30 0.0543 3 E101634 40 0.0531 4 E101634 50 0.0529 5 E101634 60 0.0519
第一步是merge_asof将样本因子带到最接近的样本。然后计算每一行的new_gauge列。但是，只有当sample\u factor介于当前行和下一行的值之间，并且coil\u id对于当前行和下一行是相同的时，我们才会实际指定一个值。你知道吗
import pandas as pd merged = pd.merge_asof(df2.assign(SAMPLE = df2.SAMPLE.astype('float')).sort_values('SAMPLE'), df1.sort_values('sample_factor'), by='coil_id', left_on='SAMPLE', right_on='sample_factor', direction='forward') print(merged) # coil_id SAMPLE GAUGE sample_factor SEQ #0 E101634 10.0 0.0550 10.4066 1 #1 E101634 20.0 0.0568 20.8132 2 #2 E101634 30.0 0.0543 31.2198 3 #3 E101634 40.0 0.0531 41.6264 4 #4 E101634 50.0 0.0529 52.0330 5 #5 E101634 60.0 0.0519 62.4396 6 # Now perform your calculation: new_gauge = (merged.GAUGE.shift(1) + ((merged.GAUGE - merged.GAUGE.shift(1))/10 * (merged.sample_factor - merged.SAMPLE.shift(1)))) # Assign it only where it makes sense # Assumes df2 was sorted on ['coil_id', 'SAMPLE'] mask = (merged.sample_factor.between(merged.SAMPLE, merged.SAMPLE.shift(-1)) & (merged.coil_id == merged.coil_id.shift(-1))) merged.loc[mask, 'new_gauge'] = new_gauge[mask]
输出：merged
coil_id SAMPLE GAUGE sample_factor SEQ new_gauge 0 E101634 10.0 0.0550 10.4066 1 NaN 1 E101634 20.0 0.0568 20.8132 2 0.056946 2 E101634 30.0 0.0543 31.2198 3 0.053995 3 E101634 40.0 0.0531 41.6264 4 0.052905 4 E101634 50.0 0.0529 52.0330 5 0.052859 5 E101634 60.0 0.0519 62.4396 6 NaN
在本例中，我们没有指定最后一行，因为您提供的子集中没有Sample>；60。你知道吗

输出：`merged`

相关问题更多 >

编程相关推荐

热门问题

热门文章