从字符串数组中删除子字符串的最有效方法

B = [] for i in range(0, len(A)): noSubstring = True for j in range(i + 1, len(A)): if A[i] in A[j]: noSubstring = False break if noSubstring: B.append(A[i])

1条回答

网友

1楼 · 发布于 2024-04-25 19:21:17

首先消除所有重复项。通过在迭代数据时使用哈希表并存储已经看到的字符串，这是相当容易做到的。（如果您担心哈希表的最坏情况，可以使用trie或排序和迭代来过滤重复）

过滤掉所有重复项后，为所有剩余字符串创建一个suffix-tree。
在创建后缀树之后，对于每个字符串，检查它是否作为某个字符串的后缀存在，而不是它本身。这是通过沿着后缀树上的路径从根到字符串的结尾来完成的，如果您的唯一选项是完全相同的字符串，那么它不是子字符串（否则-它是）。你知道吗

时间复杂性：

过滤重复：O（n*m）
在理论上建立后缀树O（n*m），但实际上是在O(n*mlog(m))中完成的。你知道吗
检查每个字符串是O（m），重复检查n字符串是O（nm）

总的复杂性是O(n*mlog(m))

相关问题更多 >

编程相关推荐

热门问题

热门文章

从字符串数组中删除子字符串的最有效方法

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >