所以我试着把描述职业的名词短语的“缩写”列表转换成那些名词短语的“完整”列表。应该是这样的:
示例(输入-->;输出):
我尝试了一种严格的基于规则的方法,但这不符合我的喜好。 我也尝试过用spaCy进行简单的分块,但最初的结果也不完美
空间代码如下所示:
import spacy
nlp = spacy.load("en_core_web_sm")
def get_chunks(sentence):
res = []
doc = nlp(u'{}'.format(sentence))
for np in doc.noun_chunks:
res.append(np.text)
return res
对于如上所述的精确输入,代码返回:
我正在考虑从这里开始采用基于规则的方法,但也许有人有更好的建议
谢谢,干杯
目前没有回答
相关问题 更多 >
编程相关推荐