Pyparsing操作符问题
我用pyparsing写了一个语法规则,但遇到了一个问题。
这个语法规则是用来解析搜索查询的(包括操作符优先级、括号等等),我希望空格能够像“与”操作符一样工作。
比如,这个查询可以正常工作:
(word and word) or word
但是这个查询就失败了:
(word word) or word
我希望第二个查询能像第一个查询那样正常工作。
我现在的语法规则是:
WWORD = printables.replace("(", "").replace(")", "")
QUOTED = quotedString.setParseAction(removeQuotes)
OAND = CaselessLiteral("and")
OOR = CaselessLiteral("or")
ONOT = "-"
TERM = (QUOTED | WWORD)
EXPRESSION = operatorPrecedence(TERM,
[
(ONOT, 1, opAssoc.RIGHT),
(OAND, 2, opAssoc.LEFT),
(OOR, 2, opAssoc.LEFT)
])
STRING = OneOrMore(EXPRESSION) + StringEnd()
1 个回答
6
解决你问题的一种方法是把“AND”定义为一个可选的操作符。如果这样做,你需要特别注意,像“and”和“or”这样的真实关键词不要被误解为搜索词。此外,使用可选操作符时,你可以添加一个默认字符串,这样即使原始搜索查询中缺少“and”,你解析后的文本也会为你自动插入它(这样后续处理会更简单)。
from pyparsing import *
QUOTED = quotedString.setParseAction(removeQuotes)
OAND = CaselessLiteral("and")
OOR = CaselessLiteral("or")
ONOT = Literal("-")
WWORD = ~OAND + ~OOR + ~ONOT + Word(printables.replace("(", "").replace(")", ""))
TERM = (QUOTED | WWORD)
EXPRESSION = operatorPrecedence(TERM,
[
(ONOT, 1, opAssoc.RIGHT),
(Optional(OAND,default="and"), 2, opAssoc.LEFT),
(OOR, 2, opAssoc.LEFT)
])
STRING = OneOrMore(EXPRESSION) + StringEnd()
tests = """\
word and ward or wird
word werd or wurd""".splitlines()
for t in tests:
print STRING.parseString(t)
结果是:
[[['word', 'and', 'ward'], 'or', 'wird']]
[[['word', 'and', 'werd'], 'or', 'wurd']]