我需要从以下svg文档中解析CDATA:
<?xml version='1.0' encoding='UTF-8'?>
<!-- This file was generated by dvisvgm 2.4 -->
<svg height='28.692695pt' version='1.1' viewBox='-72.000004 -70.904267 60.575314 28.692695' width='60.575314pt' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'>
<style type='text/css'>
<![CDATA[
text.f0 {font-family:cmex10;font-size:11.955168px}
text.f1 {font-family:cmmi12;font-size:11.955168px}
text.f2 {font-family:cmr12;font-size:11.955168px}
]]>
</style>
<g id='page1'>
<text class='f1' x='-72.000004' y='-53.569135'>c</text>
<text class='f2' x='-63.641186' y='-53.569135'>=</text>
<text class='f0' x='-51.215706' y='-70.426073'></text>
<text class='f1' x='-42.415333' y='-60.891712'>a<tspan x='-25.754955'>b</tspan>
<tspan x='-41.861851' y='-46.445899'>c</tspan>
<tspan x='-26.307752'>d</tspan>
</text>
<text class='f0' x='-20.225063' y='-70.426073'></text>
</g>
</svg>
我使用的代码如下所示:
import xml.dom.minidom
file_svg= "my_path"
doc = xml.dom.minidom.parse(file_svg)
style = doc.getElementsByTagName('style')
cdata = style[0].firstChild.wholeText
这给了我CDATA中的文本,如下所示(打印CDATA):
text.f0 {font-family:cmex10;font-size:11.955168px}
text.f1 {font-family:cmmi12;font-size:11.955168px}
text.f2 {font-family:cmr12;font-size:11.955168px}
但我需要把这篇文章组织成这样的smth:
{"f0":"cmex10","f1":"cmmi12","f2":"cmr12"}
我确信有一种方法可以根据文本值来提取数据:f0、f1、f2和字体系列的值:cmex10、cmmi12、cmr12,使用标准的xml.dom.minidom操作
我试过:
style[0].firstChild.nodeValue
但它产生了一个空字符串
你能帮我做这个吗
下面(使用ElementTree)
输出
正如注释中指出的,CDATA应该被解析为文本。下面是一个简单解析的示例:
输出:
相关问题 更多 >
编程相关推荐