我想为一堆文本建立一个语言模型。有没有什么现成的工具可以帮助我完成这个任务?我知道的唯一一个工具是卡内基梅隆大学的统计语言建模(SLM)工具包。
祝好,
KenLM 也是一个值得尝试的工具。它运行速度快,并且有很好的默认设置。与 SRILM 相比,它提供的配置选项较少。
SRILM工具包非常有用。
http://www.speech.sri.com/projects/srilm/
NLTK 是一个非常强大的工具,虽然我自己从来没有用过它。