java字符串和hashsetmembership匹配
我正在使用java中的pinyin4j包将单个汉字转换为罗马字母(拼音)。但是,这通常会为一个字符产生多个拼音(同一个字符有不同的发音)。比如说,字符C1转换为2种拼音形式p1和p2,字符C2转换为3种拼音形式q1、q2、q3
当我将C1C2组合成一个单词时,它会产生2*3=6个组合。通常只有一个词是真的。我想对照我构建的词典文本文件检查这些组合,其中许多行以\w开头,这是一个词汇条目(例如,在词典中只找到6个组合中的p1q2)。我正在考虑将词典文件读入哈希集。但是,我不确定如何最好地实施整个过程。有什么建议吗
# 1 楼答案
HashSet似乎很好。如果词典是特大的,你必须非常快,考虑使用TIE数据结构。然而,Java中有no实现