遍历两列以查看列表中是否存在子字符串，然后将其添加到第三列

YOUTUBE = ['bumper youtube','yt trueview', 'youtube trueview','yt pre-roll','youtube pre-roll','yt bumper','youtube bumper' ,'bumper','yt preferred pre-roll','youtube preferred pre-roll', 'YT preferred bumper', 'youtube preferred bumper', 'YT masthead', 'youtube masthead', 'trueview youtube','trueview']

3条回答

网友

1楼 · 编辑于 2024-06-07 09:27:18

这个实现很简单，应该可以工作。最后一个匹配项（在“行项目”或“插入顺序”列中）将覆盖任何以前的匹配项（在这两列中），此字符串是您将在每行的“创造性大小”列中看到的字符串。df_ex是示例数据帧的名称

for idx,row in df_ex.iterrows():
    for string in YOUTUBE:
        if (string in row['Line Item']) or (string in row['Insertion Order']): # can also use regex here
            df_ex.loc[idx, 'Creative Size'] = string

网友

2楼 · 编辑于 2024-06-07 09:27:18

使用^{}和+和\b\b连接的两个字符串列作为单词边界：

pat = '|'.join(r"\b{}\b".format(x) for x in YOUTUBE)
df['new'] = (df['Line Item'] + ' ' + df['Insertion Order']).str.findall(pat).str.join(', ')

print (df)
                                        Line Item  \
0       ch video cross ff bumper youtube mk it mb   
1  moisturizerbody trueview ym21998557 yt youtube   
2                                  useless string   
3    012020 trueview ym21978191 yt youtube bumper   

                  Insertion Order Creative Size                         new  
0                  gen 20 youtube       Unknown            [bumper youtube]  
1  trueview ym21998557 yt youtube       Unknown                  [trueview]  
2                           dunno       Unknown                          []  
3        davena bumper youtube 24       Unknown  [trueview, bumper youtube]

如果NEE通过,添加^{}连接字符串：

pat = '|'.join(r"\b{}\b".format(x) for x in YOUTUBE)
df['new'] = df['Line Item'].add(df['Insertion Order']).str.findall(pat).str.join(', ')

print (df)
                                        Line Item  \
0       ch video cross ff bumper youtube mk it mb   
1  moisturizerbody trueview ym21998557 yt youtube   
2                                  useless string   
3    012020 trueview ym21978191 yt youtube bumper   

                  Insertion Order Creative Size                       new  
0                  gen 20 youtube       Unknown            bumper youtube  
1  trueview ym21998557 yt youtube       Unknown                  trueview  
2                           dunno       Unknown                            
3        davena bumper youtube 24       Unknown  trueview, bumper youtube

网友

3楼 · 编辑于 2024-06-07 09:27:18

您可以找到存在匹配项的索引，并将该匹配项复制到感兴趣的列，如本例所示：

data = pd.DataFrame({"Line Item": ['nope', 'nope', 'yep1!'],"Insertion Order": ['nope', 'yep2!', 'nope'], "Creative Size": ['', '', '']})
youtube = ['foo', 'bar', 'yep1!', 'yep2!']

for col in data.columns:
    ind = data.loc[data[col].isin(youtube)].index
    data['Creative Size'].iloc[ind] = data[col].iloc[ind]

data

输出：

相关问题更多 >

编程相关推荐

热门问题

热门文章