parseString有效，scanString失败？

alpha_rev = pyp.Word(pyp.alphas, max=2) num_rev = pyp.Word('123456789', max=2) space = pyp.White(ws=" ").suppress() revisionExpr = ( pyp.StringStart().leaveWhitespace() + space + pyp.Combine(alpha_rev + pyp.Optional(num_rev)("rev")) ) rev_string = ' K WI, This is the title' for match_str, start, end in ( revisionExpr.scanString(rev_string, maxMatches=1)): print match_str ['K']

1条回答

网友

1楼 · 发布于 2024-06-11 07:47:00

问题是，您的“or”操作符（“|”）只查看其左右两侧的元素。语法元素分组不正确。以下是你的语法再分解一下：

left_expr = pyp.Combine(alpha_rev + pyp.Optional(num_rev)("rev")
right_expr = pyp.CaselessLiteral("Rev")

joined_expr = left_expr | right_expr

final_expr = (pyp.StringStart().leaveWhitespace() +
    space +
    joined_expr +
    pyp.Optional('.') +
    pyp.Combine(alpha_rev +
      pyp.Optional(num_rev)("rev"))
    )

正如您所看到的，这并不是您想要的——它将查找文本“Rev”或实际的修订，然后是另一个修订。表达式的固定版本如下：

^{pr2}$

但是，您可以使语法更加简洁：

revisionExpr = (
    pyp.StringStart().leaveWhitespace() +
    space +
    pyp.Suppress(
        pyp.Optional(
            pyp.CaselessLiteral("Rev") + 
            pyp.Optional('.')
        )
    ) +
    pyp.Combine(
        alpha_rev +
        pyp.Optional(num_rev)("rev")
    )
)

在这个版本中，您只在预期的位置将“Rev.”文本标记为可选，而不是让parse选择只解析修订或“Rev.”+修订。这完全避免了使用“|”运算符所引起的任何问题。在

别忘了PyParsing使用操作符重载来提供更好的语法，如果语法导致混乱（就像在这个场景中），那么您最好只使用长形式的方法调用，比如“pyp.或（a，b）”。在

相关问题更多 >

编程相关推荐

热门问题

热门文章