Python PLY 解析器语法错误

1 投票
1 回答
3921 浏览
提问于 2025-04-17 11:15

大家好,

我正在用 python PLY 写一个非常简单的解析器。这个解析器大部分时间能正常工作,但在处理很多输入行时,我会遇到来自 yacc 的语法错误。下面是我稍微修改过的词法分析器和解析器代码,以便于测试:

tokens = ('VAR', 'NUMBER', 'CLOSE', 'JUNK')

# Tokens

t_VAR     = r'%[mM]\['
t_CLOSE   = r'\]'
t_JUNK    = r'.'

# Ignored characters
t_ignore = " \t\r"

def t_NUMBER(t):
    r'\d+'
    try:
        t.value = int(t.value)
    except ValueError:
        print("Integer value too large %d", t.value)
        t.value = 0
    return t

def t_newline(t):
    r'\n+'
    t.lexer.lineno += t.value.count("\n")

def t_error(t):
    print("Illegal character '%s'" % t.value[0])
    t.lexer.skip(1)

# Build the lexer
import ply.lex as lex
lex.lex()

# Parsing rules

def p_statement(p):
    '''statement : field'''
    try:
        print p[1]
    except IndexError:
        pass

def p_trash(p):
    '''statement : JUNK'''
    pass

def p_field(p):
    '''field : VAR NUMBER CLOSE'''
    #print p[1], p[2], p[3]
    p[0] = p[2]

def p_error(p):
    print("Syntax error at '%s'" % repr(p)) #p.value)

import ply.yacc as yacc
yacc.yacc()

举个例子:当我运行 yacc.parse('.set %m[702] $substr($currentlength,2,$currentpg)') 时,输出结果是:

Syntax error at 'LexToken(JUNK,'s',1,1)'
Syntax error at 'LexToken(JUNK,'$',1,13)'

我希望它只输出 702

1 个回答

2

你的顶层规则需要一个单独的语句。p_trash 匹配到第一个 '.' 后就返回了一个语句,但没有顶层规则让它继续执行。你可以这样做:

def p_junk(p):
    '''statement | JUNK statement'''

你也可以这样做(并创建一个语句列表):

def p_statements(p):
    '''statements | statement statements
                  | empty'''

撰写回答