从python正则表达式中提取文本

text="The pizza was 66 and brilliant" pattern = r""" P: {<NN>+<VBD>+<CD>+} """ for sent in sent_tokenize(text): sentence = sent.split() PChunker = RegexpParser(pattern) output= PChunker.parse(pos_tag(sentence)) print(output)

1条回答

网友

1楼 · 发布于 2024-04-20 13:50:27

的输出RegexpParser.parse是一个可以循环使用的树树.子树. 尝试以下操作，立即筛选出您感兴趣的非终端节点（在您的示例中是P）：

from nltk import sent_tokenize
from nltk import RegexpParser
from nltk import pos_tag

text="The pizza was 66 and brilliant"
pattern = r"""
P: {<NN>+<VBD>+<CD>+}
"""
for sent in sent_tokenize(text):
  sentence = sent.split()
  PChunker = RegexpParser(pattern)
  output= PChunker.parse(pos_tag(sentence))
  print(output)
  for subtree in output.subtrees(filter=lambda t: t.label() == 'P'):
      print(subtree)
      print(' '.join([x[0] for x in subtree]))

编程相关推荐

javafx在java中显示图像或形状的二维网格
java如何部署WAR文件而不是根文件。AWS Elastic Beanstalk中配置了Amazon AMI的war？
java如何在Eclipse中设置runnable jar的目标版本
Java 8流/收集器按地图分组
java ParseServer:不保存用户信息？
MySQL:java。sql。BatchUpdateException:键“PRIMARY”的重复条目“242243”
java Jersey测试框架为grizzly中的所有未知路径定义默认错误响应
java使用所有请求参数将请求从一个jsp转发到另一个jsp？
java为什么在JavaFX8中选择CheckboxTableCell时SelectedStateCallback不起作用？
期待EOF的java发现“异常”

相关问题更多 >

编程相关推荐

热门问题

热门文章

从python正则表达式中提取文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >