Pyparsing操作符问题

3 投票
1 回答
997 浏览
提问于 2025-04-16 12:10

我用pyparsing写了一个语法规则,但遇到了一个问题。

这个语法规则是用来解析搜索查询的(包括操作符优先级、括号等等),我希望空格能够像“与”操作符一样工作。

比如,这个查询可以正常工作:

(word and word) or word

但是这个查询就失败了:

(word word) or word

我希望第二个查询能像第一个查询那样正常工作。

我现在的语法规则是:

WWORD = printables.replace("(", "").replace(")", "")
QUOTED = quotedString.setParseAction(removeQuotes)

OAND = CaselessLiteral("and")
OOR = CaselessLiteral("or")
ONOT = "-"

TERM = (QUOTED | WWORD)

EXPRESSION = operatorPrecedence(TERM,
    [
        (ONOT, 1, opAssoc.RIGHT),
        (OAND, 2, opAssoc.LEFT),
        (OOR, 2, opAssoc.LEFT)
    ])

STRING = OneOrMore(EXPRESSION) + StringEnd()

1 个回答

6

解决你问题的一种方法是把“AND”定义为一个可选的操作符。如果这样做,你需要特别注意,像“and”和“or”这样的真实关键词不要被误解为搜索词。此外,使用可选操作符时,你可以添加一个默认字符串,这样即使原始搜索查询中缺少“and”,你解析后的文本也会为你自动插入它(这样后续处理会更简单)。

from pyparsing import *

QUOTED = quotedString.setParseAction(removeQuotes)  
OAND = CaselessLiteral("and") 
OOR = CaselessLiteral("or") 
ONOT = Literal("-")
WWORD = ~OAND + ~OOR + ~ONOT + Word(printables.replace("(", "").replace(")", ""))
TERM = (QUOTED | WWORD)  
EXPRESSION = operatorPrecedence(TERM,
    [
    (ONOT, 1, opAssoc.RIGHT),
    (Optional(OAND,default="and"), 2, opAssoc.LEFT),
    (OOR, 2, opAssoc.LEFT)
    ])

STRING = OneOrMore(EXPRESSION) + StringEnd()

tests = """\
word and ward or wird
word werd or wurd""".splitlines()

for t in tests:
    print STRING.parseString(t)

结果是:

[[['word', 'and', 'ward'], 'or', 'wird']]
[[['word', 'and', 'werd'], 'or', 'wurd']]

撰写回答