我在找一个测试文件,用来测试我的句子分割应用程序,希望这个文件能包含尽可能多的情况。
谢谢!
查看一下Lingua::Sentence的文档。文档里会提到它使用的语料库,以及一些相关的句子拆分模块。你也可以看看测试文件。
Lingua::Sentence