如何使用数据帧通过词性标记NLTK覆盖单词?你知道吗
例如,我有:
data = pd.read_csv('dataset.csv', delimiter='\t', names=columns)
data['POSTags'] = pos_tag_sents(data['Sentence'].apply(word_tokenize).tolist())
我的意见:
DAW1 was further investigated by
立即输出:
[('DAW1', 'NNP'), ('was', 'VBD'), ('further', 'RBR'), ('investigated', 'VBN'), ('by', 'IN')]
我需要输出:
NNP VBD RBR VBN IN
目前没有回答
相关问题 更多 >
编程相关推荐