具有多个DOCTYPE声明的XML

<?xml version="1.0" ?> <!DOCTYPE pmc-articleset PUBLIC "-//NLM//DTD ARTICLE SET 2.0//EN" "https://dtd.nlm.nih.gov/ncbi/pmc/articleset/nlm-articleset-2.0.dtd"> <pmc-articleset><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" article-type="research-article"> <?properties open_access?> <front> <p> Apple </p> </front> </article> </pmc-articleset> <?xml version="1.0" ?> <!DOCTYPE pmc-articleset PUBLIC "-//NLM//DTD ARTICLE SET 2.0//EN" "https://dtd.nlm.nih.gov/ncbi/pmc/articleset/nlm-articleset-2.0.dtd"> <pmc-articleset><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" article-type="research-article"> <?properties open_access?> <front> <p> Banana </p> </front> </article> </pmc-articleset>

2条回答

网友

1楼 · 编辑于 2024-04-28 21:27:00

可以使用^{}将文件拆分为多个部分，这是任务的实用工具

或者在XML声明<?xml ...

csplit -z  prefix output_file  suffix-format '%02d.xml' your_large.xml '/^<[?]xml[ ]/' {*}

或者，如果没有重复，在<!DOCTYPE

csplit -z  prefix output_file  suffix-format '%02d.xml' your_large.xml '/<!DOCTYPE/' {*}

这将导致{}、{}等

网友

2楼 · 编辑于 2024-04-28 21:27:00

如果您的输入文档prolog实际上包含多个文档类型声明（多个doctype），或者似乎没有文档元素，那么它很可能是完整的SGML而不是XML。尽管您的示例代码两者都没有

相关问题更多 >

编程相关推荐

热门问题

热门文章