pyparsing检索动态长度字符串的结果键

import pyparsing as pars dot = pars.Literal(".") question = pars.Literal("?") comma = pars.Literal(",") total = pars.OneOrMore( pars.Group( pars.OneOrMore(dot)("dot") | pars.OneOrMore(question)("question") ) + pars.Optional(comma) ) result = total.parseString("...,?????,..,??")

<ITEM> <dot> <dot>.</dot> <ITEM>.</ITEM> <ITEM>.</ITEM> </dot> <ITEM>,</ITEM> <question> <question>?</question> <ITEM>?</ITEM> <ITEM>?</ITEM> <ITEM>?</ITEM> <ITEM>?</ITEM> </question> <ITEM>,</ITEM> <dot> <dot>.</dot> <ITEM>.</ITEM> </dot> <ITEM>,</ITEM> <question> <question>?</question> <ITEM>?</ITEM> </question> </ITEM>

1条回答

网友

1楼 · 发布于 2024-04-20 14:02:38

我通常不鼓励使用asXML()方法—它已被弃用，可能会在2.2版中消失。如果改用dump()，您将看到您拥有的是一个命名组的序列，而不是dict，因此asDict()只提供键控值的输出，在顶层没有任何可处理的内容。你知道吗

print(result.dump())

[['.', '.', '.'], ',', ['?', '?', '?', '?', '?'], ',', ['.', '.'], ',', ['?', '?']]
[0]:
  ['.', '.', '.']
  - dot: ['.', '.', '.']
[1]:
  ,
[2]:
  ['?', '?', '?', '?', '?']
  - question: ['?', '?', '?', '?', '?']
[3]:
  ,
[4]:
  ['.', '.']
  - dot: ['.', '.']
[5]:
  ,
[6]:
  ['?', '?']
  - question: ['?', '?']

要获得每个解析的位，而不是调用asDict()或asList()，只需直接迭代结果。如果对每个列表元素调用asDict()，您将看到您的命名值：

for r in result:
    if isinstance(r, pars.ParseResults):
        print(r.asDict())

{'dot': ['.', '.', '.']}
{'question': ['?', '?', '?', '?', '?']}
{'dot': ['.', '.']}
{'question': ['?', '?']}

也可以对这些子元素使用getName()：

for r in result:
    if isinstance(r, pars.ParseResults):
        print(r, r.getName())

['.', '.', '.'] dot
['?', '?', '?', '?', '?'] question
['.', '.'] dot
['?', '?'] question

编辑

另外，考虑更换：

total = pars.OneOrMore(
    pars.Group(
        pars.OneOrMore(dot)("dot")
        | pars.OneOrMore(question)("question")
    )
    + pars.Optional(comma)
)

与

total = delimitedList(pars.Group(pars.OneOrMore(dot)("dot") | 
                                 pars.OneOrMore(question)("question"))))

当您有一个由逗号分隔的事物列表时，逗号通常在解析时提供帮助，但是在解析之后，您真正想要的只是那些事物。delimitedList为您执行此操作（逗号是默认分隔符，但您可以传递另一个分隔符作为可选的delim参数）。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章