我有这样一种形式的数据:类别和值在同一行中,用“;”分隔,如下所示:
{{category1;value}, {category2;value}, {category3;value} ....}}
每一行的数据都可能有不同数量的类别。因此,第一行可能有类别1到类别5,而第二行可能有类别1到类别10。不过,分类总是按顺序排列的。你知道吗
我需要解析数据并创建一个新文件,以便在列标题中有类别的名称,在相应的行中有值。你知道吗
category1 category2 category3 category4 ....
value value value value
但由于我不能说可能有多少个类别,我需要添加每个新列。所以,解析第一行我就知道有5列(cat1到cat5),但是对于第二行,我必须添加cat6到cat10的列,以此类推。你知道吗
你知道怎么做吗。任何Linux bash脚本都可以,但python对我来说更可取。你知道吗
给出注释后,听起来
category
可以包含分号以外的任何字符,value
可以包含右大括号以外的任何字符,因为这些字符会过早终止category
或value
。你知道吗在这种情况下,可以使用正则表达式来匹配模式。你知道吗
收益率
可能有很多方法可以做到这一点,但一个可能的方法是
和上面的小变化
还有另一个使用regex的变体
相关问题 更多 >
编程相关推荐