我想知道如何从如下列表中删除特定单词,包括stopwords:
my_list=[[],
[],
['A'],
['SB'],
[],
['NMR'],
[],
['ISSN'],
[],
[],
[],
['OF', 'USA'],
[],
['THE'],
['HOME'],
[],
[],
['STAR'],
[]]
如果是字符串列表,我会应用如下内容:
from collections import Counter
stop_words = stopwords.words('english')
text = ' '.join([word for word in my_list if word not in stop_words])
我需要在最后画出这样的图:
counts= Counter(chain.from_iterable(my_list))
plt.bar(*zip(*counts.most_common(20)))
plt.show()
预期绘制的列表:
my_list=[[],
[],
['SB'],
[],
['NMR'],
[],
['ISSN'],
[],
[],
[],
['USA'],
[],
['HOME'],
[],
[],
['STAR'],
[]]
循环通过
my_words
,将每个嵌套列表替换为已删除停止词的列表。您可以使用“设置差异”删除单词不敏感地进行比较会变得更复杂一些,因为您不能使用内置的set-difference方法
相关问题 更多 >
编程相关推荐