在庞大的关键字列表中检查单词的最快方法Python performan问题的回答

在庞大的关键字列表中检查单词的最快方法Python performan

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

感谢您的快速反应。Stackoverflow太棒了！ 我需要检查一个单词（或者更确切地说是数千个单词）是否与包含关键字的dict匹配。在 例如，假设我有一个字符串：<code>"The fluffy fox jumped the friggin fence."</code>我需要对照关键字dict检查字符串中的每个单词，如果匹配，则返回所有值。在 我创建了一个dict <code>filters</code>：（<code>uniqueid</code>的意思是“lk2m3lk4m2”，其余的是“static”。） <pre><code>filters: { "fox" : [ { 'subscription' : 'uniqueid', 'link' : 'uniqueid' }, { 'subscription' : 'uniqueid', 'link' : 'uniqueid' } ]}, { "fence" : [ { 'subscription' : 'uniqueid', 'link' : 'uniqueid' } ]} </code></pre> …并计划对字符串中每个单词的过滤器进行迭代（我必须以每秒5000个单词的速度执行此操作。换句话说，绩效是最重要的问题。在 过滤关键字的数量可能会增加到数千个，而字符串永远不会超过一个正常的句子长度（即5-20个单词）。因此，我将遍历字符串中的每个单词，并检查它是否包含在过滤器列表中。然而，在500句/秒的速度下，我仍然需要大量的计算。在 例如，是否可以对列表进行排序（例如，dict在list中的键），从而显著提高性能？有没有我应该使用的C实现（比如我使用cjson获得了很好的性能增益）？在 很抱歉这个问题有些不稳定，但我该怎么做这个任务呢？在 编辑： 预期输入： <code>"The fluffy fox jumped the friggin fence."</code> 预期输出： <code>{ 'subscription' : 'flskdmfslk32232', 'link' : 'sfdksmfls22323' }, { 'subscription' : '3023940fsdf', 'link' : 'sdflsfm223' }</code> （即每个匹配关键字下列出的订阅）

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

在庞大的关键字列表中检查单词的最快方法Python performan

1 个回答

相关Python问题