在庞大的关键字列表中检查单词的最快方法Python performan

filters: { "fox" : [ { 'subscription' : 'uniqueid', 'link' : 'uniqueid' }, { 'subscription' : 'uniqueid', 'link' : 'uniqueid' } ]}, { "fence" : [ { 'subscription' : 'uniqueid', 'link' : 'uniqueid' } ]}

2条回答

网友

1楼 · 编辑于 2024-04-29 07:39:13

您可以通过简单地filters.has_键（文字）或通过做：

subscriptions = filters.get(word)
if subscriptions is not None:
    pass # TODO do something with subscriptions

或者：

^{pr2}$

不需要迭代过滤器中的每个条目。相反，您需要拆分输入字符串，将每个单词添加到一个集合中（以消除重复），然后在集合上迭代以在过滤器字典中查找每个单词。在

网友

2楼 · 编辑于 2024-04-29 07:39:13

在Python中最快的方法是使用字典查找句子中的每个单词，然后累加和关联的值。主数据结构可能如下所示：

filters = {
    "fox" : (
              ('uniqueid1', 'uniqueid2'),
              ('uniqueid3', 'uniqueid4'),
            ),
    "fence" : (
                ('uniqueid5', 'uniqueid6'),
              ),
          }

使用这种方式（在8位字符上）：

^{pr2}$

或者，它可能会更快（是时候找出答案），这样可以避免双重字典查找：

from string import punctuation

def map_words(sentence):
    for word in sentence.translate(None, punctuation).split():
        try:
            yield filters[word]
        except KeyError:
            pass

sentence = 'The fluffy fox jumped the friggin fence.'
print [v for v in map_words(sentence)]

不管怎样，这就是输出：

[(('uniqueid1', 'uniqueid2'), ('uniqueid3', 'uniqueid4')), (('uniqueid5', 'uniqueid6'),)]

相关问题更多 >

编程相关推荐

热门问题

热门文章

在庞大的关键字列表中检查单词的最快方法Python performan

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >