擅长:python、mysql、java
<p>如果您事先知道所有查询,或者准备对它们进行批处理,另一种方法是从它们构建一个<a href="http://en.wikipedia.org/wiki/Aho%E2%80%93Corasick_string_matching_algorithm" rel="nofollow">http://en.wikipedia.org/wiki/Aho%E2%80%93Corasick_string_matching_algorithm</a>树。这使得查询的总大小呈线性。然后,您可以将10GB的数据流化,时间与该数据的大小和任何字符串找到匹配项的次数成正比。在</p>