擅长:python、mysql、java
<p>也许可以构建一个哈希表,其中包含尽可能多的n元组的计数?你可以修剪那些不再出现的树。我不会称之为“近似值”,但可以是“上界”,保证检测不出现的字符串。在</p>
<p>所以,假设您可以构建所有4元组。在</p>
<p>然后,要计算“ABCD ef”的出现次数,您需要的最小值是count(ABCD)、count(BCDE)、count(CDEF)。如果其中任何一个值为零,则保证不会出现该字符串。如果是一个,它最多会出现一次(但可能根本不会出现)。在</p>