Python，如何解析key=value list忽略括号内的内容？

def pparams(parameters, sep=';', defs='=', brc='()'): ''' unpackages parameter string to struct for example, pippo(a=21;b=35;c=pluto(h=zzz;y=mmm);d=2d3f) becomes: a: '21' b: '35' c.fn: 'pluto' c.h='zzz' d: '2d3f' fn_: 'pippo' ''' ob=strfind(parameters,brc[0]) dp=strfind(parameters,defs) out={} if len(ob)>0: if ob[0]<dp[0]: #opening function out['fn_']=parameters[:ob[0]] parameters=parameters[(ob[0]+1):-1] if len(dp)>0: temp=smart_tokenize(parameters,sep,brc); for v in temp: defp=strfind(v,defs) pname=v[:defp[0]] pval=v[1+defp[0]:] if len(strfind(pval,brc[0]))>0: out[pname]=pparams(pval,sep,defs,brc); else: out[pname]=pval else: out['fn_']=parameters return out def smart_tokenize( instr, sep=';', brc='()' ): ''' tokenize string ignoring separators contained within brc ''' tstr=instr; ob=strfind(instr,brc[0]) while len(ob)>0: cb=findclsbrc(tstr,ob[0]) tstr=tstr[:ob[0]]+'?'*(cb-ob[0]+1)+tstr[cb+1:] ob=strfind(tstr,brc[1]) sepp=[-1]+strfind(tstr,sep)+[len(instr)+1] out=[] for i in range(1,len(sepp)): out.append(instr[(sepp[i-1]+1):(sepp[i])]) return out def findclsbrc(instr, brc_pos, brc='()'): ''' given a string containing an opening bracket, finds the corresponding closing bracket ''' tstr=instr[brc_pos:] o=strfind(tstr,brc[0]) c=strfind(tstr,brc[1]) p=o+c p.sort() s1=[1 if v in o else 0 for v in p] s2=[-1 if v in c else 0 for v in p] s=[s1v+s2v for s1v,s2v in zip(s1,s2)] s=[sum(s[:i+1]) for i in range(len(s))] #cumsum return p[s.index(0)]+brc_pos def strfind(instr, substr): ''' returns starting position of each occurrence of substr within instr ''' i=0 out=[] while i<=len(instr): try: p=instr[i:].index(substr) out.append(i+p) i+=p+1 except: i=len(instr)+1 return out

3条回答

网友

1楼 · 编辑于 2024-04-30 04:24:57

如果您想构建一个真正的解析器，可以使用Python parsing libraries，比如PLY或{a3}。如果你认为这样一个功能齐全的库对于手头的任务来说太过了，那就去做一些像你已经拥有的那样的黑客吧。我很确定没有外部库就没有干净的几行解决方案。在

网友

2楼 · 编辑于 2024-04-30 04:24:57

您可以使用regex来捕获组：

>>> import re
>>> s = "key1=value1;key2=value2;key3=(key3.1=value3.1;key3.2=value3.2)"
>>> r = re.compile('(\w+)=(\w+|\([^)]+\));?')
>>> dict(r.findall(s))

此正则表达式表示：

^{pr2}$

不得不说，有点奇怪的语法。你应该考虑使用更标准的格式。如果你需要指导，选择一个也许再问另一个问题。祝你好运！在

网友

3楼 · 编辑于 2024-04-30 04:24:57

扩展Sven Marnach的答案，下面是一个pyparsing语法的示例，它应该适合您：

from pyparsing import (ZeroOrMore, Word, printables, Forward,
                       Group, Suppress, Dict)


collection = Forward()
simple_value = Word(printables, excludeChars='()=;')
key = simple_value
inner_collection = Suppress('(') + collection + Suppress(')')
value = simple_value ^ inner_collection
key_and_value = Group(key + Suppress('=') + value)
collection << Dict(key_and_value + ZeroOrMore(Suppress(';') + key_and_value))


coll = collection.parseString(
    "key1=value1;key2=value2;key3=(key3.1=value3.1;key3.2=value3.2)")

print coll['key1']             # value1
print coll['key2']             # value2
print coll['key3']['key3.1']   # value3.1

相关问题更多 >

编程相关推荐

热门问题

热门文章