我正在尝试清理一些数据,包括“6cm*8cm”、“6cmx8cm”和“6*8”等文本。我想修改它们,使它们变得相似。请注意,数字是可变的,因此数据可能有“3cm*4cm”等
# input strings
strings = [
"6cm*8cm",
"12mmx15mm",
'Device stemmer 2mm*8mm',
'Device stemming 2mmx8mm'
]
# My desired output would be:
desired_strings = [
'6*8',
'12*15',
'Device stemmer 2*8',
'Device stemming 2*8'
]
我正在使用python的“re”。我的偏好是将它们转换为简单的“6*8”(即数字*数字)。请注意,在一些条目中,数据包含诸如“Device stemmer 2mm*8mm”之类的字符串,我不想更改其他单词
正则表达式是否有一种pythonic的方式来修改所有可能的数字和单位组合
我用过:
注:
([0-9]+)
:匹配数字,(cm|mm)
:匹配单元,|
表示逻辑OR
,(\*|x)
:匹配\*
或x
作为对的分隔符,\1
:给出第一个组(这里是第一个数字,例如6),\4
:给出第四组(这里是第二个数字,例如8)https://regex101.com/这个answer有帮助
相关问题 更多 >
编程相关推荐