NLTK：从字符串到带有“slashtokens”单词/POS的树？

spacy2tree(nlp(u'Williams is a defensive coach') ) Tree('S', [Tree('SUBJ', [(u'Williams', u'NNP')]), Tree('PRED', [(u'is', u'VBZ'), ('test', 'VBN')]), (u'a', u'DT'), (u'defensive', u'JJ'), (u'coach', u'NN')])

tfs = spacy2tree(nlp(u'Williams is a defensive coach') ).pformat() Tree.fromstring(tfs) Tree('S', [Tree('SUBJ', ['Williams/NNP']), Tree('PRED', ['is/VBZ', 'test/VBN']), 'a/DT', 'defensive/JJ', 'coach/NN'])

correct incorrect ('SUBJ', [(u'Williams', u'NNP')]) =vs=> ('SUBJ', ['Williams/NNP']) ('PRED', [(u'is', u'VBZ'), ('test', 'VBN')]) =vs=> ('PRED', ['is/VBZ', 'test/VBN'])

1条回答

网友

1楼 · 发布于 2024-06-01 03:42:01

看来我明白了：

 : Tree.fromstring(tfs, read_leaf=lambda s : tuple(s.split('/')))
 : Tree('S', [Tree('SUBJ', [(u'Williams', u'NNP')]), 
         Tree('PRED', [(u'is', u'VBZ'), (u'test', u'VBN')]), (u'a', u'DT'), (u'defensive', u'JJ'), (u'coach', u'NN')])

因此，现在这也可以正常工作：

: tree2conlltags(Tree.fromstring(tfs, read_leaf=lambda s : tuple(s.split('/'))))
 : 
 [(u'Williams', u'NNP', u'B-SUBJ'),
  (u'is', u'VBZ', u'B-PRED'),
  (u'test', u'VBN', u'I-PRED'),
  (u'a', u'DT', u'O'),
  (u'defensive', u'JJ', u'O'),
  (u'coach', u'NN', u'O')]

相关问题更多 >

编程相关推荐

热门问题

热门文章