如何根据另一列中满足的条件在dataframe中添加新列？

import numpy as np import pandas as pd something = [[1, "p", "dsd"], [3, "t", "dsd"], [6, "u", "jgddf"], [1, "p", "dsd"], [4, "l", "jgddf"], [1, "t", "dsd"], [3, "t", "dsds"], [6, "c", "cxxc"], [1, "p", "dsd"], [4, "l", "vdv"]] test = pd.DataFrame(something) test = test.drop_duplicates() test.columns = ['id', 'state', 'level'] test = test.sort_values(by=['id'], ascending=True) test_unique = test["id"].unique() df_aslist = test.groupby(['id']).aggregate(lambda x: list(x)).reset_index() #making it a set to remove duplicates df_aslist['level'] = df_aslist['level'].apply(lambda x: list(set(x))) print(df_aslist) conditions = [(df_aslist["level"].str.contains("ds") & df_aslist["level"].str.contains("sd")), (df_aslist["level"].str.contains("cx") & df_aslist["level"].str.contains("vd"))] values = ["term 1", "term 2"] df_aslist["label"] = np.select(conditions, values) print(df_aslist)

1条回答

网友

1楼 · 发布于 2024-06-16 08:57:00

尝试使用astype()方法：

df_aslist[['state','level']]=df_aslist[['state','level']].astype(str)
#the above code change the list inside your columns to string

conditions=[(df_aslist["level"].str.contains("ds") & df_aslist["level"].str.contains("sd")),
            (df_aslist["level"].str.contains("cx") & df_aslist["level"].str.contains("vd"))
           ]

values = ["term 1", "term 2"]

df_aslist["label"] = np.select(conditions, values)

最后筛选出您的数据帧：

df_aslist=df_aslist.query("label!='0'")

如果您打印df_aslist，您将获得所需的输出

注意：如果您想要返回这些列表，请使用pd.eval()：

df_aslist[['state','level']]=df_aslist[['state','level']].apply(pd.eval)

相关问题更多 >

编程相关推荐

热门问题

热门文章