正则表达式：捕获一组开头相同的行？

In : p = re.compile( r'•.*(?!^•)' ) In : p.findall(text, re.MULTILINE, re.DOTALL) Out : [] In : p.findall(text, re.MULTILINE) Out : ['• item 1', '• item 2', '• item 3'] In : p.findall(text, re.DOTALL) Out : ['• item 1', '• item 2', '• item 3'] In : p.findall(text) Out : ['• item 1', '• item 2', '• item 3']

3条回答

网友

1楼 · 编辑于 2024-06-17 12:38:33

下面是一个基于非正则表达式的解决方案：

with open('/tmp/example.txt') as f:
  lines_in = f.readlines()

inside_block = False
lines_out = []

for line in lines_in:
  if line.startswith('&bull; '):
    if not inside_block:
      lines_out.append('<ul>\n')
      inside_block = True
    lines_out.append('<li>{}</li>\n'.format(line.strip().replace('&bull; ','')))
  else:
    if inside_block:
      lines_out.append('</ul>\n')
      inside_block = False
    lines_out.append(line)

print ''.join(lines_in)
print '-'*78
print ''.join(lines_out)

试运行：

^{pr2}$

网友

2楼 · 编辑于 2024-06-17 12:38:33

将内容读入字符串，然后在“&bull；”上拆分。迭代元素，在每个元素之前和之后分别添加“<；li>；”和“<；\li>；”。在

网友

3楼 · 编辑于 2024-06-17 12:38:33

首先必须将所有项目符号更改为<li>元素，然后在第二次执行时将它们包含在<ul>元素中。在

下面是一个java示例。Python还使用PCRE，因此它的工作方式应该相同：

    String test = "&bull; item 1\r\n&bull; item 2\r\n&bull; item 3\r\n";
    test = test.replaceAll("&bull; (.*)(?!^&bull;)", "<li>$1</li>");
    System.out.println(test);
    test = test.replaceAll("(?s)(<li>.+</li>)+?", "<ul>\n$1\n</ul>");
    System.out.println(test);

输出：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章