有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java如何在使用JDOM2解析XML时忽略注释内容

在使用JDOM解析器解析xml时,我遇到了一些问题。当我试图检索内容时,它会给我注释行。有没有办法让我们可以忽略这些注释行

Java代码:

SAXBuilder jdomBuilder = new SAXBuilder();
    // jdomDocument is the JDOM2 Object
    Document jdomDocument = jdomBuilder.build("C:/manu/WebservicesWS/DynamicXmlParse/src/PO_XML.xml");
    // The root element is the root of the document. we print its name
    System.out.println(jdomDocument.getRootElement().getName()); // prints
                                                                    // "rss"
    Element rss = jdomDocument.getRootElement();
    System.out.println(rss.getNamespaceURI());
    List<Element> rssChildren = rss.getChildren();
    // getElement(rssChildren);
    for (int i = 0; i < rssChildren.size(); i++) {
        Element rssChild = rssChildren.get(i);
        System.out.println(rssChild.getName());// prints 'title' and 'link'
        List<Content> rssContents = rssChild.getContent();
        for (int j = 0; j < rssContents.size(); j++) {
            Content content = rssContents.get(j);
            System.out.println(content.getValue());
        }
    }

XML结构

<interchange-control-header>
    <control-number>2</control-number>
    <sender-id>ZZ:IQAAOBUYER7</sender-id>
    <receiver-id>ZZ:33347456972</receiver-id>
    <!--sender-id>ZZ:IQAAOBUYER2</sender-id>
    <receiver-id>ZZ:IQAAOSUPPLIER2</receiver-id>        
    <sender-id>IQAOrionBuyer</sender-id>
    <receiver-id>IQAOrionSupplier</receiver-id-->           
    <date-time>2012-06-29T09:30:47-05:00</date-time>
    <control-version>1</control-version>
    <usage-indicator>T</usage-indicator>
    <is-copy>0</is-copy>
</interchange-control-header>

电流输出

interchange-control-header
2
ZZ:IQAAOBUYER7
ZZ:33347456972
sender-id>ZZ:IQAAOBUYER2</sender-id>
    <receiver-id>ZZ:IQAAOSUPPLIER2</receiver-id>        
    <sender-id>IQAOrionBuyer</sender-id>
    <receiver-id>IQAOrionSupplier</receiver-id
2012-06-29T09:30:47-05:00
1
T
0

所需输出:

interchange-control-header
2
ZZ:IQAAOBUYER7
ZZ:33347456972
2012-06-29T09:30:47-05:00
1
T
0

共 (1) 个答案

  1. # 1 楼答案

    注释被认为是XML文档中可识别的一部分,以及更明显的元素等内容。其他需要注意的内容包括处理说明、文本和实体引用

    rssChild元素上调用getContent时,会得到注释内容,其值是该内容中的文本

    似乎您只想打印出每个子元素的文本内容,而不是所有内容

    获取所有子元素的简单方法是使用the ^{} method(而不是getContent)。你已经在其他地方使用getChildren了,所以我不确定你为什么忘了在这里使用它

    此外,您可以简化每个样式的循环。。。此代码:

    List<Element> rssChildren = rss.getChildren();
    // getElement(rssChildren);
    for (int i = 0; i < rssChildren.size(); i++) {
        Element rssChild = rssChildren.get(i);
        System.out.println(rssChild.getName());// prints 'title' and 'link'
        List<Content> rssContents = rssChild.getContent();
        for (int j = 0; j < rssContents.size(); j++) {
            Content content = rssContents.get(j);
            System.out.println(content.getValue());
        }
    }
    

    可能是:

    for (Element rssChild : rss.getChildren()) {
        System.out.println(rssChild.getName());// prints 'title' and 'link'
        for (Element subRss : rssChild.getChildren()) {
            System.out.println(subRss.getValue());
        }
    }