我正在尝试在不使用python包的情况下将XML转换为JSON。为此,我将XML转换为一个列表,该列表最终将转换为嵌套字典,然后再转换为JSON。从列表中读取XML时,我无法区分以下元素:
<Description>TestData</Description>\n
Data</Description>\n
<Description>Test\n
我用来区分1和3的正则表达式是:
x = re.compile("<Description>(.+?)<\/Description>\n")
x = re.compile("^((?!Description).)*<\/Description>\\n")
我发现很难为第三个开发正则表达式。你知道吗
x = re.compile("\s*<Description>(.+)(?!((<\/Description>)))\n")
尽管第二个正则表达式正确地标识了文本3,但它也标识了文本1。这应该只识别文本3。你知道吗
你想要这样的东西吗?你知道吗
Demo
python脚本是
输出为
似乎
capture[0]
值就是你想要的。。你知道吗你很接近。这个正则表达式可以满足您的需要:
我刚在两个字母之间加了“<;”?还有!做一个否定的后视断言。查看此项以获取更多信息:https://docs.python.org/2/library/re.html
相关问题 更多 >
编程相关推荐