有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java字符串和hashsetmembership匹配

我正在使用java中的pinyin4j包将单个汉字转换为罗马字母(拼音)。但是,这通常会为一个字符产生多个拼音(同一个字符有不同的发音)。比如说,字符C1转换为2种拼音形式p1和p2,字符C2转换为3种拼音形式q1、q2、q3

当我将C1C2组合成一个单词时,它会产生2*3=6个组合。通常只有一个词是真的。我想对照我构建的词典文本文件检查这些组合,其中许多行以\w开头,这是一个词汇条目(例如,在词典中只找到6个组合中的p1q2)。我正在考虑将词典文件读入哈希集。但是,我不确定如何最好地实施整个过程。有什么建议吗


共 (1) 个答案

  1. # 1 楼答案

    HashSet似乎很好。如果词典是特大的,你必须非常快,考虑使用TIE数据结构。然而,Java中有no实现