被正则表达式难住了

l_12_interval j_10_int Length:100 Min. :-2120803808 Class :character 1st Qu.: -992076064 Mode :character Median : 263935522 Mean : -33801580 3rd Qu.: 896644601 Max. : 1890084945 NA's :53

>>> re.sub(r"^.*\s([a-z1-9][a-z1-9.' ]*:)", r"\1", line, re.IGNORECASE) ' Length:100 Min. :-2120803808' >>> re.sub(r"^.* ([a-z1-9][a-z1-9.' ]*:)", r"\1", line, re.IGNORECASE) ' Length:100 Min. :-2120803808' >>> re.sub(r"^.*( [a-z1-9][a-z1-9.' ]*:)", r"\1", line, re.IGNORECASE) ' Length:100 Min. :-2120803808' >>> re.sub(r"^.*(\w[a-z1-9][a-z1-9.' ]*:)", r"\1", line, re.IGNORECASE) 'in. :-2120803808'

3条回答

网友

1楼 · 编辑于 2024-04-19 02:12:12

如果您不必使用正则表达式并且列具有固定宽度，那么下面的示例也适用于您。你知道吗

with open("data", "rb") as f:
    for line in f:
        print(line.strip("\n")[19:])

这将输出：

   j_10_int
Min.   :-2120803808
1st Qu.: -992076064
Median :  263935522
Mean   :  -33801580
3rd Qu.:  896644601
Max.   : 1890084945
NA's   :53

网友

2楼 · 编辑于 2024-04-19 02:12:12

Ide不编写python正则表达式。你知道吗

因此，如果这是一个一次性的工作，那么我有一个PerlOneLiner给你。你知道吗

perl -pe 's/^\w++\s++(\w++)/\t$1/||s/.*?\s*+:\s*+\w++\s++(.*)/$1/||s/\s++(.*)/$1/' FILE.txt > NEWFILE.txt

在从文件FILE.txt到文件NEWFILE.txt中生成所需输出的

我希望这是有用的。你知道吗

诀窍是在:之前寻找垃圾，然后是可能的空格和一组单词字符，然后是一些空格。在那之后的一切都是你要找的。你知道吗

我还处理了其他情况，如第一行和剥离一些行的前导空格。你知道吗

网友

3楼 · 编辑于 2024-04-19 02:12:12

这一点基于许多关于名称格式和第一列值格式的假设，但它适用于您的示例：

^(?:[A-Z][a-z]+\s*:[a-z0-9]*|)\s*([A-Z0-9].*)$

根据您对不同名称和值的格式的确切了解，可能需要做更多的工作。你知道吗

演示： http://regex101.com/r/oP3pT2

相关问题更多 >

编程相关推荐

热门问题

热门文章