使用python在匹配模式的多行之间提取字符串

dummy line 1 dummy line 2 create_list animal -list tiger create_list bird -list crow dummy line 3 create_list car -list ford/mustang dummy line 4 dummy line 5 create_list truck -list ford/F150 create_list human -list { jack john}

import re def extractListItems(File): f = open(File,"r") content = f.read() list_items = [] for m in re.finditer(r'(?:\bcreate_list+\s+\S+\s+-list+\s*)((?:\b\S+\b(?:\s*))+)(?:\n)', content): list_items.extend(re.split(r'\s+', m.group(1).strip())) print (list_items) f.close() extractListItems("samplefile.txt")

2条回答

网友

1楼 · 编辑于 2024-04-26 21:28:18

如果你的内容总是以空格开头，那么试试这个

import re

def extractListItems(File):
    f = open(File,"r")
    content = f.read().splitlines()
    pattern=lambda data:len(re.findall(r"^\s+",data))
    lst=[c.strip() for c in content if pattern(c)>0]
    print(lst)
    f.close()

extractListItems("samplefile.txt")

输出

['tiger', 'crow', 'ford/mustang']

或者

 pattern=lambda data:re.findall(r"^[\s].*",data)
 lst=[val[0].strip() for val in map(pattern,content) if val]

结果

 ['tiger', 'crow', 'ford/mustang']

网友

2楼 · 编辑于 2024-04-26 21:28:18

我假设你要匹配的词总是缩进的。你知道吗

import re
regex = r"^\s+(\S.*)"

test_str = ("dummy line 1\n"
    "dummy line 2\n"
    "create_list animal -list     \n"
    "  tiger\n"
    "create_list bird -list        \n"
    "  crow\n"
    "dummy line 3\n"
    "create_list car -list        \n"
    "  ford/mustang\n"
    "dummy line 4\n"
    "dummy line 5")

match = re.findall(regex, test_str, re.MULTILINE)
print(match)

输出

['tiger', 'crow', 'ford/mustang']

输出

相关问题更多 >

编程相关推荐

热门问题

热门文章