按里程碑元素拆分XML文档。
milestone的Python项目详细描述
这对于包含多个层次结构的XML文件很有用。
示例
一个例子是一个名为tei的xml方言,它可能已经被创建了 使用章节(div元素)来表示一本书,但是您要使用 逐页文本(pb元素)。
假设一个名为myfile.xml的XML文件包含里程碑 元素<;pb/>;分布在整个XML中。
下面的命令将把输入文件分割成单独的输出 每个pb元素的文件:
python3 milestone.py -t pb myfile.xml
或者,如果您通过PIP安装了模块,则可以使用:
python3 -m milestone -b pb myfile.xml
以上命令将用整数命名输出文件。
现在假设<;pb>;元素有一个名为'n'的属性 我们要用于每个输出文件的名称。
下面的命令将把输入文件分割成单独的输出 文件,根据“n”属性命名:
python3 milestone.py -t pb -n n myfile.xml
如果要转换层次结构但不将数据拆分为 单独的文件,您可以使用-x标志:
python3 milestone.py -x -t pb -n n myfile.xml > outputfile.xml
若要在自己的代码中将其用作库,请导入 里程碑类:
from milestone import Milestone
要分享想法或改进,请访问github项目:
https://github.com/zeth/milestone