在正则输出中将字符串位置映射到行号

3 投票
1 回答
2859 浏览
提问于 2025-04-15 14:50

我正在用Python开发一个类似于“grep”的工具,用来搜索Oracle源代码文件。因为编码标准随着时间的推移而变化,所以像“从表a.foo中删除所有内容”这样的语句可能会跨越多行,或者不跨越,这取决于那段代码的年代:

s = """-- multiline DDL statement
DELETE
    a.foo f
WHERE
    f.bar = 'XYZ';

DELETE a.foo f
WHERE f.bar = 'ABC';

DELETE a.foo WHERE bar = 'PDQ';
"""

import re

p = re.compile( r'\bDELETE\b.+?a\.foo', re.MULTILINE | re.DOTALL )

for m in re.finditer( p, s ):
    print s[ m.start() : m.end() ]

这段代码的输出是:

DELETE
    a.foo
DELETE a.foo
DELETE a.foo

我想要的结果是:

[2] DELETE
[3]     a.foo
[7] DELETE a.foo
[10] DELETE a.foo

有没有什么简单快捷的方法,可以把字符串的索引映射到行号上?

1 个回答

8
lineno = s.count("\n",0,m.start())+1

当然可以!请把你想要翻译的内容发给我,我会帮你用简单易懂的语言解释清楚。

撰写回答