使用NLTK进行上下文无关语法分析，但会出现形容词问题

%start S #Feature based context-free grammar #Base start is sentence S[SEM=<?vp(?np)>] -> NP[NUM=?n, SEM=?np] VP[NUM=?n,SEM=?vp] #Verb phrase expansion products VP[NUM=?n,SEM=?v] -> LV[NUM=?n] NP[SEM=?v] VP[NUM=?n,SEM=<?v(?obj)>] -> TV[NUM=?n,SEM=?v] NP[SEM=?obj] #Noun phrase expansion products NP[SEM=<?conj(?np1,?np2)>] -> NP[SEM=?np1] CC[SEM=?conj] NP[SEM=?np2] NP[NUM=?n] -> Ger N[NUM=?n] NP[NUM=?n, SEM=?np] -> N[NUM=?n, SEM=?np] NP[NUM=?n, SEM=<?adj(?np)>] -> ADJ[SEM=?adj] N[NUM=?n, SEM=?np] #Following expansion is shorthand for substantive adjective NP[SEM=?np] -> Adj[SEM=?np] #Lexical productions Ger -> 'smoking' N[NUM=sg, SEM=<\P.P(cocaine)>] -> 'gum' N[NUM=sg, SEM=<\P.P(sh$%)>] -> 'bad' LV[NUM=sg] -> 'is' LV[NUM=pl] -> 'are' ADJ[SEM=<\x.pretty(x)>] -> 'pretty'

1条回答

网友

1楼 · 发布于 2024-05-16 05:49:05

不知道你有什么问题。我把你的语法粘贴到SOgrammar.fcfg 代码：

from nltk import load_parser
cp = load_parser('SOgrammar.fcfg')
sentences = ['gum is pretty', 'gum is bad', 'gum is pretty bad']
for sentence in sentences:
    tokens = sentence.split()
    print("tokens:", tokens)
    for tree in cp.parse(tokens):
        print("tree;", tree)

输出：

^{pr2}$

它能解析“口香糖很糟糕”。它不解析“gum is pretty”，因为pretty被定义为一个形容词。根据你的语法，NP不能只由形容词组成。在

补充评论；从语言学的角度来看，“漂亮”并不是真正的形容词。“bad”不是一个真正的名词。根据你想要达到的目标，这可能并不重要（如果你的语法/领域真的很小），但是当你开始写更大的语法时，坚持使用有更多/更好的语言动机的单词类型是个好主意。在

相关问题更多 >

编程相关推荐

热门问题

热门文章