pandas：在每行Datafram上应用函数

| val1 | val2 | val3 | brand | gender | color |---------------------------------------------------- | Nike | NaN | NaN | Nike | NaN | NaN | Men | Adidas | NaN | Adidas | Men | NaN | Puma | Red | Women | Puma | Women | Red

ref_brands = enchant.request_pwl_dict("ref_brands.txt") brands_checker = SpellChecker(ref_brands) print brands_checker.check('Puma') > True print brands_checker.check('Men') > False [pyenchant tutorial][1] def my_cust_check(x, checker): l = x.tolist() for e in iter(l): try: if checker.check(e.strip().encode('utf-8')) is True: return e.strip() else: return None except: return None df_query_split['brand'] = df_query_split.apply(my_cust_check,checker=brand_checker, axis=1) df_query_split['gender'] = df_query_split.apply(my_cust_check,checker=gender_checker, axis=1) df_query_split['color'] = df_query_split.apply(my_cust_check,checker=color_checker, axis=1)

1条回答

网友

1楼 · 发布于 2024-05-15 22:20:02

您可以使用：

df['brand'] = df[df.isin(Brands)].ffill(axis=1).iloc[:, -1]
df['gender'] = df[df.isin(Gender)].ffill(axis=1).iloc[:, -1]
df['color'] = df[df.isin(Color)].ffill(axis=1).iloc[:, -1]
print (df)
   val1    val2   val3   brand gender color
0  Nike     NaN    NaN    Nike    NaN   NaN
1   Men  Adidas    NaN  Adidas    Men   NaN
2  Puma     Red  Women    Puma  Women   Red

详细信息：

首先按^{}比较：

^{pr2}$

提取Trues的值：

print (df[df.isin(Brands)])
   val1    val2 val3
0  Nike     NaN  NaN
1   NaN  Adidas  NaN
2  Puma     NaN  NaN

将NaNs替换为^{}，并使用前向填充（ffill）：

print (df[df.isin(Brands)].ffill(axis=1))
   val1    val2    val3
0  Nike    Nike    Nike
1   NaN  Adidas  Adidas
2  Puma    Puma    Puma

按^{}查看最后一列：

print (df[df.isin(Brands)].ffill(1).iloc[:, -1])
0      Nike
1    Adidas
2      Puma
Name: val3, dtype: object

相关问题更多 >

编程相关推荐

热门问题

热门文章