如何使用datafram通过POS标记覆盖单词

2024-03-28 11:55:13 发布

您现在位置:Python中文网/ 问答频道 /正文

如何使用数据帧通过词性标记NLTK覆盖单词?你知道吗

例如,我有:

data = pd.read_csv('dataset.csv', delimiter='\t', names=columns)

data['POSTags'] = pos_tag_sents(data['Sentence'].apply(word_tokenize).tolist())

我的意见:

DAW1 was further investigated by

立即输出:

[('DAW1', 'NNP'), ('was', 'VBD'), ('further', 'RBR'), ('investigated', 'VBN'), ('by', 'IN')]

我需要输出:

NNP VBD RBR VBN IN

Tags: csv数据in标记databywas词性