从逐字提取主题
matcher-pcx-synomia的Python项目详细描述
匹配器PCX滑膜炎
逐字提取主题。
版本1.1.1
发布日期:2019-08-07
开始
PIP安装…
先决条件
- 手稿: $pip安装flashtext
用法
- 您需要一个具有以下结构的ListCix.txt:
manque de place=><manque de place;place;-1< personnel désagréable=><personnel désagréable;personnel;-1< train direct=><train direct;train;1<
- 初始匹配器:
themes_matcher = matcher.ThemesMatcher('lexicon.txt')
- 逐字提取主题:
verbatims = ["Le confort et la propreté","Rapidité (Train Direct), mais personnel désagréable","c'est catastrophique… retards chroniques, personnel désagréable","Le manque de place ds le tgv"] vbs2matches = themes_matcher.match(verbatims) print(vbs2matches) {'Rapidité (Train Direct), mais personnel désagréable': [['train direct', 'train', '1'], ['personnel désagréable', 'personnel', '-1']], 'Le confort et la propreté': [], 'Le manque de place ds le tgv': [['manque de place', 'place', '-1']], "c'est catastrophique… retards chroniques, personnel désagréable": [['personnel désagréable', 'personnel', '-1']]}
作者
- synomia