从逐字提取主题

matcher-pcx-synomia的Python项目详细描述


匹配器PCX滑膜炎

逐字提取主题。

版本1.1.1

发布日期:2019-08-07

开始

PIP安装…

先决条件

  • 手稿: $pip安装flashtext

用法

  • 您需要一个具有以下结构的ListCix.txt:

manque de place=><manque de place;place;-1< personnel désagréable=><personnel désagréable;personnel;-1< train direct=><train direct;train;1<

  • 初始匹配器:

themes_matcher = matcher.ThemesMatcher('lexicon.txt')

  • 逐字提取主题:

verbatims = ["Le confort et la propreté","Rapidité (Train Direct), mais personnel désagréable","c'est catastrophique… retards chroniques, personnel désagréable","Le manque de place ds le tgv"] vbs2matches = themes_matcher.match(verbatims) print(vbs2matches) {'Rapidité (Train Direct), mais personnel désagréable': [['train direct', 'train', '1'], ['personnel désagréable', 'personnel', '-1']], 'Le confort et la propreté': [], 'Le manque de place ds le tgv': [['manque de place', 'place', '-1']], "c'est catastrophique… retards chroniques, personnel désagréable": [['personnel désagréable', 'personnel', '-1']]}

作者

  • synomia

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在sqlite数据库中保存特定列的历史记录   java如何更改/更新timeseriechart名称(JFreeChart)   java如何将整数转换为可绘制的   汇编什么解释Java的字节码   java查找已编译的类版本号   我应该什么时候在ColdFusion应用程序中使用Java?   java当一个实体的两个字段为(unique=true)时,如何处理JPA异常?   java为什么在所有其他实例都正确的情况下返回错误的布尔值?   java Hibernate每次都准备语句   java停留在平均字长上   对Java和日语字符进行编码   java如何将导致异常的方法的错误消息传递给侦听器中的onTestFailure方法   java代码没有打印结果   java为什么私有内部接口的方法必须是公共的?   休眠发生错误。有关详细信息,请参阅错误日志。JAVAlang.NullPointerException