从词性标注结果中检索标记

2024-05-16 03:44:39 发布

您现在位置:Python中文网/ 问答频道 /正文

使用python如何从

('[', 'NN'), 
("u'Tradus-Under", 'NN'), 
("'", "''"), 
(',', ','), 
("u'Maintenance", 'JJ'), 
("'", "''"), 
(']', ':')

即从词性标注结果。你知道吗


Tags: nnmaintenanceunder词性jjtradus
1条回答
网友
1楼 · 发布于 2024-05-16 03:44:39

假设这些元素在一个列表中(我称之为列表lst):

import string
lst = [
    ('[', 'NN'),
    ("u'Tradus-Under", 'NN'),
    ("'", "''"),
    (',', ','),
    ("u'Maintenance", 'JJ'),
    ("'", "''"),
    (']', ':')
]

tags = []
for _,poss_tag in lst:
    if(len(poss_tag) == 2 and 
           poss_tag[0] == poss_tag[1] and 
           poss_tag[0] in string.ascii_letters):
        tags.append(poss_tag)

print(tags)

输出:

['NN', 'NN', 'JJ']

如果您想要一个独特的集合,您可以将它反弹到一个集合并返回:

print(list(set(tags)))

输出:

['JJ', 'NN']

相关问题 更多 >