短语:生成给定语料库的短语

phrase的Python项目详细描述


短语

基于nltk和gensim自动生成短语的库。

安装

使用pip将包添加到python路径:

`bash pip install phrase `

用法

创建短语词典并打印出前25个短语:

`bash create_phrase_dictionary <corpus_folder> <phrase_dictionary_output_filename> `

这不是一个轻松的过程,它可能需要大量的记忆和时间,所以要注意。

测试

要运行所有测试,需要运行py.test来获取单元测试。莴苣目前正用于bdd检测。 需要从tests文件夹运行,或者将tests/添加到pythonpath中(测试使用units.helpers模块) `bash py.test PYTHONPATH=tests lettuce tests/features cd tests lettuce features/ `

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Spring框架服务单元测试   在Java中遍历hashmaps的hashmap以检索字符串值   如何使用CodeQL检查Java注释是否具有特定属性?   java为什么在Spring Boot中访问此资源而不是登录弹出窗口需要始终获得完全身份验证   处理将多集计数转换为列表的过程   java另一个线性布局,没有出现按钮   eclipse Java映像加载未显示在jar中   java Junit类无法加载基本测试类ApplicationContext   java如何在main中使用my getvalues()方法打印列表   java Sonar,S128:切换案例应该以无条件的“中断”语句结束,而不是继续   java从socket读取字符串错误连接重置错误   java使用新数据刷新任意图表饼图   java通过异步运行lambda访问方法参数   java错误的结果一旦我处理try and catch