我想从每一行中提取对(动词-名词)我想添加其他列并将所有对放在那里我使用Eron数据集我做了第一部分的预处理(删除数字、标点符号…),知道我想检测(动词-名词)有什么帮助吗
import spacy
import numpy as np
nlp = spacy.load('en')
a=nlp(str(train['text_lemmatized'])
noun_adj_pairs=[]
for i,token in enumerate(a):
if token.pos not in ('VERB','NOUN'):
continue
for j in range(i+1,len(a)):
if a[j].pos_ == 'NOUN':
noun_adj_pairs.append((token,a[j]))
break
noun_adj_pairs
目前没有回答
相关问题 更多 >
编程相关推荐