鲁滨逊·克鲁索的解析包。
Peglet的Python项目详细描述
小木桩
peglet扩展了python的正则表达式来处理递归 格莱美奖。例如,要解析html的一小部分:
>>> from peglet import Parser >>> a_little_html = Parser(r""" ... parts = part parts | ... part = <(\w+)> parts </\w+> group ... | ([^<]+) ... """, group=lambda *values: values) >>> a_little_html("Hello. <p><em>Nesting</em> for <i>the win</i>.</p>") ('Hello. ', ('p', ('em', 'Nesting'), ' for ', ('i', 'the win'), '.'))
目标是建立一个解析库
- 使用起来很愉快;
- 如果我面对一些新的 一种新的编程语言;
- 有足够容易遵循的代码,它可以向人们介绍 正在分析。
所以它归结为一页清晰的代码没有使用组合词。(和 然后从文档和一些附加文档中扩展到200多行。) 一些不符合后两个约束的位进入了 组合库,parson。
有关详细信息,请参见the examples或 the code中的模块文档。
安装它
pip install peglet,或者下载然后python setup.py install。