中文字符的字符串搜索算法
有一些Python代码可以用来实现普通的字符串搜索算法,比如Boyer-Moore算法。我想用这个算法来处理中文字符,但感觉同样的实现方法可能不太适用。那么我该怎么做才能让这个算法也能处理中文字符呢?我指的是这个:
http://en.literateprograms.org/Boyer-Moore_string_search_algorithm_(Python)#References
1 个回答
3
只要你的所有文本都是用Unicode编码的,就应该没问题。这个算法看起来和顺序无关,只要每个“元素”的长度都是一个序列单位就行。