сопоставить положение строки с номером строки в выводе регулярного выражения - PullRequest
3 голосов
/ 06 октября 2009

Я работаю над "grep-like" утилитой в Python для поиска файлов исходного кода Oracle. Стандарты кодирования со временем менялись, поэтому попытка найти что-то вроде «все удаления из таблицы a.foo» может занимать несколько строк или нет в зависимости от возраста этого фрагмента кода:

s = """-- multiline DDL statement
DELETE
    a.foo f
WHERE
    f.bar = 'XYZ';

DELETE a.foo f
WHERE f.bar = 'ABC';

DELETE a.foo WHERE bar = 'PDQ';
"""

import re

p = re.compile( r'\bDELETE\b.+?a\.foo', re.MULTILINE | re.DOTALL )

for m in re.finditer( p, s ):
    print s[ m.start() : m.end() ]

Это выводит:

DELETE
    a.foo
DELETE a.foo
DELETE a.foo

Что я хочу:

[2] DELETE
[3]     a.foo
[7] DELETE a.foo
[10] DELETE a.foo

Существует ли быстрый / простой / встроенный способ сопоставления строковых индексов с номерами строк?

1 Ответ

7 голосов
/ 06 октября 2009
lineno = s.count("\n",0,m.start())+1
...