关键字匹配时的数据分析（列表列）

0 K Ieatapple 1 Y bananaisdelicious 2 B orangelikesomething 3 Q bluegrape 4 C appleislike mylist = [apple, banana] #keyword matching df[df['Value'].str.contains("|".join(mylist))] Name Value 0 K I eat apple 1 Y banana is delicious 4 C appleislike #output what I want matching word frequency : apple : 2, banana : 1

1条回答

网友
1楼 · 发布于 2024-05-16 10:52:25

如果只想匹配一个，则第一个匹配的值将^{}与列表中的联接值一起使用：
df['new'] = df['Value'].str.extract(f'({"|".join(mylist)})', expand=False) print (df) Name Value new 0 K I eat apple apple 1 Y banana is delicious banana 4 C appleislike apple
对于计数，使用^{}：
s = df['new'].value_counts() print (s) apple 2 banana 1 Name: new, dtype: int64 print ('matching word frequency: ' + ', '.join(f'{k}:{v}' for k, v in s.items())) matching word frequency: apple:2, banana:1
如果要匹配所有值，请使用^{}和^{}：
extracted = df['Value'].str.findall(f'({"|".join(mylist)})') df['new'] = extracted.str.join(',') print (df) Name Value new 0 K I eat apple and banana apple,banana 1 Y banana is delicious banana 4 C appleislike apple
对于计数，使用带有^{}和value_counts的DataFrame余构造函数：
s = pd.DataFrame(extracted.tolist()).stack().value_counts() print (s) apple 2 banana 2 dtype: int64 print ('matching word frequency: ' + ', '.join(f'{k}:{v}' for k, v in s.items())) matching word frequency: apple:2, banana:2

相关问题更多 >

编程相关推荐

热门问题

热门文章