获取字符串序列的加权值

df['value_score'] = (df['value'].str.count('aa', regex=False) * weights['aa'] + df['value'].str.count('bb', regex=False) * weights['bb'] + df['value'].str.count('cc', regex=False) * weights['cc'] )

2条回答

网友

1楼 · 编辑于 2024-04-26 22:19:30

将列表理解与get一起用于0用于不匹配的值：

df['value_score'] = df['value'].apply(lambda x: sum(weights.get(y, 0) for y in x.split()))
print (df)
         value  value_score
0  aa aa bb cc          3.5
1     dd ee aa          1.0
2     ff aa cc          1.5

另一种解决方案：

df['value_score'] = df['value'].str.split(expand=True).stack().map(weights).sum(level=0)
print (df)
         value  value_score
0  aa aa bb cc          3.5
1     dd ee aa          1.0
2     ff aa cc          1.5

网友

2楼 · 编辑于 2024-04-26 22:19:30

您可以使用^{}：

from collections import Counter

df['value_score'] = [sum(weights.get(k, 0) * v for k, v in Counter(x.split()).items()) \
                     for x in df['value']]

print(df)

         value  value_score
0  aa aa bb cc          3.5
1     dd ee aa          1.0
2     ff aa cc          1.5

没有矢量化的解决方案是可能的。为了提高性能，您应该支持列表理解而不是Pandasstr方法。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

获取字符串序列的加权值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >