pandas:根据另一个列表列中的条件从列表列返回值

2024-04-20 01:10:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个类似于下面的列表列的大型数据框,但有更多的行和列:

import pandas as pd

data = {'First':  [['First', 'value'],['second','value'],['third','value','is'],['fourth','value','is']],
'Second': [['adj','noun'],['adj','noun'],['adj','noun','verb'],['adj','noun','verb']]}

df = pd.DataFrame (data, columns = ['First','Second'])

如果第一列中的值等于第二列中的条件,我想从第一列返回该值。所以我喜欢的是第三列,如果第二列中的值等于'adj'

所需的第三列:

third column:
first
second
third
fourth

由于我的数据集很大,我至少尝试过过滤数据集中包含值“adj”的行,但不知道如何继续:

df[['First','Second']][df['Second'].map(set(['adj']).issubset)]

Tags: 数据df列表dataisvaluefirstpd
1条回答
网友
1楼 · 发布于 2024-04-20 01:10:59

如果每个列表中始终有adj,则按.index获取索引,并从第二个列表中选择按其值:

df['new'] = [a[b.index('adj')] for a, b in df[['First','Second']].to_numpy()]

如果不存在更一般的工作adj

df['new'] = [a[b.index('adj')] if 'adj' in b else None 
              for a, b in df[['First','Second']].to_numpy()]

apply替代:

f = lambda x: x['First'][x['Second'].index('adj')] if 'adj' in x['Second'] else None
df['new'] = df.apply(f, axis=1)


print (df)
                 First             Second     new
0       [First, value]        [adj, noun]   First
1      [second, value]        [adj, noun]  second
2   [third, value, is]  [adj, noun, verb]   third
3  [fourth, value, is]  [adj, noun, verb]  fourth

相关问题 更多 >