Python NLTK parse tagged text：如何检索标记的tex

tokens = nltk.regexp_tokenize(test_sentence, ptrn_for_tokenizer, flags = flags ) tagged_text = regexp_tagger.tag(tokens) only_tags = [tag for text, tag in tagged_text] grammar = CFG.fromstring(GRAMMAR) parser = nltk.ChartParser(grammar, trace=0) trees = parser.parse(only_tags)

1条回答

网友

1楼 · 发布于 2024-04-20 04:15:00

我理解您为POS标记编写语法的动机：NLTK基于规则的解析器没有足够的空间容纳大量词汇，因为它们是不打算实际使用的教学工具。我不太确定您的解析树是什么样子的，但是如果POS标记是叶节点，您可以编辑树并将单词放回原处。在

我将首先编写一个示例树的代码，该树类似于解析器可能提供给您的内容：

mytree = nltk.Tree.fromstring("(S (DP D (AP A N)) (VP V))")

下面是如何把这些词放回原处：

^{pr2}$

编程相关推荐

java从BatchUpdateException确定每行执行失败的原因
switch语句的java替代方案
java是一个范围内的所有毕达哥拉斯三胞胎
java ComboPooledDataSource com。太阳代理$Proxy78无法强制转换为oracle。sql。克洛布
Eclipse Java编辑器不显示减号（）
JavaFX/JavaFX根据另一个可观察属性过滤可观察列表
设计模式如何在Java项目中构造我的类
性能交换机与ArrayList Java
java如何将Cucumber与TestNG示例集成？
如何在groovy中使用JIRA REST客户端JAVA创建特定项目的版本并获取任何版本的详细信息？

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python NLTK parse tagged text：如何检索标记的tex

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >