正则表达式用于查找后跟某些字符的数字

网友

1楼 · 编辑于 2024-04-24 20:59:18

我想用占位符代替正确的时间后，找到错误的时间会容易得多。然后我们可以更正错误的时间格式，然后再次用实际时间替换占位符

这是一个简单的实现，你可以调整它来满足你的需要

import re

texts = ["Mon-Wed 6-7:30pm",
"Tuesday/Thurs 5:00 - 6:30",
"M/T/W 3:30 -7",
"F 4-5",]

def get_placeholder_replacer(replaced_strings):
    def replace_with_placeholder(x):
        replaced_strings.append(x[0])
        return "{}"
    return replace_with_placeholder


ptrn_correct_time = re.compile(r"\d+:\d+")
ptrn_incorrect_time = re.compile(r"\d{1,2}")

for text in texts:
    replaced_strings = []
    placeholder_replacer = get_placeholder_replacer(replaced_strings)
    new_text = ptrn_correct_time.sub(placeholder_replacer,text)
    new_text = ptrn_incorrect_time.sub(lambda x: "{}:00".format(x[0]), new_text)

    print(new_text.format(*replaced_strings))

## Output
# Mon-Wed 6:00-7:30pm
# Tuesday/Thurs 5:00 - 6:30
# M/T/W 3:30 -7:00
# F 4:00-5:00

网友

2楼 · 编辑于 2024-04-24 20:59:18

我将采用两阶段的方式，利用re.split的一个有趣特性，示例数据：

line1 = 'Mon-Wed 6-7:30pm'
line2 = 'Tuesday/Thurs 5:00 - 6:30'
line3 = 'M/T/W 3:30 -7'
line4 = 'F 4-5'

功能：

def add_zeros(line):
    parts = re.split(r'(\d{1,2}:\d{1,2})',line)
    parts[::2] = [re.sub(r'(\d{1,2})',r'\1:00',p) for p in parts[::2]]
    return ''.join(parts)

用法：

print(add_zeros(line1)) # Mon-Wed 6:00-7:30pm
print(add_zeros(line2)) # Tuesday/Thurs 5:00 - 6:30
print(add_zeros(line3)) # M/T/W 3:30 -7:00
print(add_zeros(line4)) # F 4:00-5:00

说明：

我给re.sub组中的第一个参数。re.split给出了一个list，奇数索引元素是分隔符。根据我在re.split中使用的模式，分隔符是“就绪”时间（不需要零填充）。然后我在列表的每个偶数索引元素（非“就绪”小时）上使用re.sub，将每1或2位数字视为一个小时，并将其替换为紧跟:00的数字

网友

3楼 · 编辑于 2024-04-24 20:59:18

您可以使用负向后看和负向前看(?<!(:)\d)\d(?!(:|\d))https://regex101.com/r/nAQh3e/4 这将挑选出之前或之后没有数字，并且还没有:的数字

相关问题更多 >

编程相关推荐

热门问题

热门文章

正则表达式用于查找后跟某些字符的数字

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >