基于NLTK的分块关系抽取

grammar = r""" NP: {<DT|JJ|NN.*>+} # Chunk sequences of DT, JJ, NN PP: {<IN><NP>} # Chunk prepositions followed by NP VP: {<VB.*><NP|PP|CLAUSE>+$} # Chunk verbs and their arguments CLAUSE: {<NP><VP>} # Chunk NP, VP """

1条回答

网友

1楼 · 发布于 2024-06-16 16:45:59

我不能对关系提取部分发表评论，尤其是因为你没有详细说明你想做什么以及你拥有什么样的数据。所以这是一个相当片面的答案。在

a.) How does cascading chunking work in NLTK b.) Is it possible to treat the chunker like a context-free grammar, and if so, how?

正如我在NLTK书中对"Building nested structure with cascaded chunkers"部分的理解，您可以将其与上下文无关的语法一起使用，但是您必须反复应用它来获得递归结构。chunker是平坦的，但是可以在chunks上添加chunk。在

c.) How can I use chunking to perform relation extraction?

我真的说不出来，不管怎样，正如我说的，你没有给出任何细节；但是如果你在处理真实的文本，我的理解是，手工编写的规则集对于任何任何任务都是无用的，除非你有一个庞大的团队和大量的时间。看看NLTK附带的概率工具。如果你有一个带注释的训练语料库，这会容易得多。在

不管怎样，还有几条关于RegexpParser的注释。在

您将在http://www.nltk.org/howto/chunk.html上找到更多的使用示例。（不幸的是，这不是一个真正的操作指南，而是一个测试套件。）
根据this,可以指定多个展开规则，如下所示：
```
patterns = """NP: {<DT|PP\$>?<JJ>*<NN>}
    {<NNP>+}
    {<NN>+}
"""
```
我应该补充一点，语法可以有多个规则，并且具有相同的左侧。这样可以增加分组相关规则等的灵活性。

相关问题更多 >

编程相关推荐

热门问题

热门文章