如果我有一个具有以下布局的数据帧:
ID# Response
1234 Covid-19 was a disaster for my business
3456 The way you handled this pandemic was awesome
我希望能够从列表中计算特定单词的频率
list=['covid','COVID','Covid-19','pandemic','coronavirus']
最后,我想生成一个字典,如下所示
{covid:0,COVID:0,Covid-19:1,pandemic:1,'coronavirus':0}
请帮助我,我真的被困在如何用python编写代码上了
尝试使用
np.hstack
和Counter
:对于每个字符串,查找匹配数
注意
Series.str.count
接受正则表达式输入。您可能需要附加(?=\b)
以获得积极的先行词结尾Series.str.count
在计算NA
时返回NA
,因此,用0填充。对于每个字符串,在列上求和相关问题 更多 >
编程相关推荐