Я работаю над "grep-like" утилитой в Python для поиска файлов исходного кода Oracle. Стандарты кодирования со временем менялись, поэтому попытка найти что-то вроде «все удаления из таблицы a.foo» может занимать несколько строк или нет в зависимости от возраста этого фрагмента кода:
s = """-- multiline DDL statement
DELETE
a.foo f
WHERE
f.bar = 'XYZ';
DELETE a.foo f
WHERE f.bar = 'ABC';
DELETE a.foo WHERE bar = 'PDQ';
"""
import re
p = re.compile( r'\bDELETE\b.+?a\.foo', re.MULTILINE | re.DOTALL )
for m in re.finditer( p, s ):
print s[ m.start() : m.end() ]
Это выводит:
DELETE
a.foo
DELETE a.foo
DELETE a.foo
Что я хочу:
[2] DELETE
[3] a.foo
[7] DELETE a.foo
[10] DELETE a.foo
Существует ли быстрый / простой / встроенный способ сопоставления строковых индексов с номерами строк?