从Python列表的元素中删除字符串

print c[25:50] ['aluminum co of america', 'aluminum co of america', 'aluminum co of america', 'aluminum company of america', 'aluminum company of america', 'aluminum co of america', 'aluminum company of america', 'aluminum company of america', 'asset acceptance capital corp.', 'asset acceptance capital corp.', 'asset acceptance capital corp.', 'asset acceptance capital corp.', 'asset acceptance capital corp.', 'asset acceptance capital corp.', 'asset acceptance capital corp.', 'asset acceptance capital corp.', 'ace cash express, inc.', 'ace cash express, inc.', 'airtran holdings, inc.', 'airtran holdings, inc.', 'airtran holdings, inc.', 'airtran holdings, inc.', 'airtran holdings, inc.', 'airtran holdings, inc.', 'airtran holdings, inc.']

2条回答

网友

1楼 · 编辑于 2024-05-18 23:41:54

# Using Generator Expression with `Counter` to speed it up a little bit
from collections import Counter
count = Counter(item for e in c for item in e.split())

# Get most frequently used words
words = {item for item, cnt in count.most_common(6)}

# filter the `words` in `c` and reconstruct the sentences in `c`
[" ".join([item for item in e.split() if item not in words]) for e in c]

网友

2楼 · 编辑于 2024-05-18 23:41:54

可以使用正则表达式将要删除的单词替换为空字符串：

import re
p = re.compile(' |'.join(word for word in count))
cleaned = [p.sub('', item) for item in c]

edit：虽然，您必须转义regex中的.和&，因此它将变得比上面更复杂一些。。。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章