在一列中使用 .isin() 函数测试的替代值（针对pandas（python））

df1 = pd.DataFrame(['apple and banana are sweet fruits','how fresh is the banana','cherry from japan'],columns=['fruits_names']) df2 = pd.DataFrame([['apple','red'],['banana','yellow'],['cherry','black']],columns=['fruits','colors'])

colors =[] for f in df1.fruits_names.str.split().apply(set): #convert content in a set with splitted words color = [df2[df2['fruits'].isin(f)]['colors']] #matching fruits in a list colors.append(color)

df1['color'] = colors output: fruits_names color 0 apple and banana are sweet fruits [[red, yellow]] 1 how fresh is the banana [[yellow]] 2 cherry from japan [[black]]

2条回答

网友

1楼 · 编辑于 2024-05-19 00:06:02

我想你需要：

print(df1)

    fruits_names
0   green apple and banana are sweet fruits
1   how fresh is the banana
2   cherry and opal apple from japan

使用split和df.explode()

df2["fruits"] = df2["fruits"].apply(lambda x: x.split("|"))

df2 = df2.explode("fruits")

print(df2)

输出：

   fruits              colors
0   green apple        red
0   opal apple         red
1   banana             yellow
1   cavendish banana   yellow
2   cherry             black

把它转换成dict

d = {i:j for i,j in zip(df2["fruits"].values, df2["colors"].values)}

基于条件创建列

df1["colors"] = [[v for k,v in d.items() if k in x] for x in df1["fruits_names"]]

print(df1)

最终输出：

    fruits_names                            colors
0   green apple and banana are sweet fruits [red, yellow]
1   how fresh is the banana                 [yellow]
2   cherry and opal apple from japan        [red, black]

网友

2楼 · 编辑于 2024-05-19 00:06:02

import pandas as pd
import numpy as np
df1 = pd.DataFrame(['green apple and banana are sweet fruits','how fresh is the banana','cherry from japan'],columns=['fruits_names'])
df2 = pd.DataFrame([['green apple|opal apple','red'],['banana|cavendish banana','yellow'],['cherry','black']],columns=['fruits','colors'])
df2['sep_colors'] = np.where(df2['fruits'], (df2['fruits'].str.split(pat='|')), df2['fruits'])


dic = dict(zip(df2['colors'].tolist(),df2['sep_colors'].tolist()))

final = []
for row in range(len(df1.fruits_names)):
    list1 = []
    for key, value in dic.items():
        for item in value:
            if item in df1.iloc[row][0]:
                list1.append(key)
    final.append(list1)

df1['colors'] = final

相关问题更多 >

编程相关推荐

热门问题

热门文章