Рубиновый эквивалент "grep -C 5", чтобы получить контекст строк вокруг совпадения? - PullRequest
6 голосов
/ 03 мая 2010

Я немного искал это, но я должен использовать неправильные термины - есть ли у ruby ​​способ найти строку / регулярное выражение, а также вернуть окружающие 5 строк (выше и ниже)? Я знаю, что мог бы просто позвонить "grep -C 5 ..." или даже написать свой собственный метод, но кажется, что что-то будет у ruby, и я просто не использую правильные условия поиска.

Ответы [ 3 ]

6 голосов
/ 04 мая 2010

Вы можете сделать это с помощью регулярного выражения. Вот строка, которую мы хотим найти:

s = %{The first line
The second line
The third line
The fourth line
The fifth line
The sixth line
The seventh line
The eight line
The ninth line
The tenth line
}

EOL для меня "\ n", но для вас это может быть "\ r \ n". Я вставлю это в константу:

EOL = '\n'

Чтобы упростить регулярное выражение, мы определим шаблон для «контекста» только один раз:

CONTEXT_LINES = 2
CONTEXT = "((?:.*#{EOL}){#{CONTEXT_LINES}})"

И мы будем искать любую строку, содержащую слово «пятый». Обратите внимание, что это регулярное выражение должно захватывать всю строку, включая конец строки, чтобы оно работало:

regexp = /.*fifth.*#{EOL}/

Наконец, выполните поиск и покажите результаты:

s =~ /^#{CONTEXT}(#{regexp})#{CONTEXT}/
before, match, after = $1, $2, $3
p before    # => "The third line\nThe fourth line\n"
p match     # => "The fifth line\n"
p after     # => "The sixth line\nThe seventh line\n"
2 голосов
/ 04 сентября 2013

Спасибо за контекстный grep. Я подумал, что могу добавить, что когда Матч идет вверху или внизу, и вы все еще хотите все строки, которые вы можно получить даже без всех доступных строк CONTEXT_LINES, вы можете изменить определение КОНТЕКСТ должно быть следующим:

CONTEXT = "((?:.*#{EOL}){0,#{CONTEXT_LINES}})"

По умолчанию совпадения являются жадными, поэтому если часть или все строки CONTEXT_LINES доступно, это то, что вы захватите.

0 голосов
/ 04 мая 2010

Я не думаю, что вы можете предоставить аргументы для grep; на основе API .

Вы всегда можете написать метод. Что-то вроде этого:

def new_grep(enum, pattern, lines)
 values = enum.grep(/pattern/).map do |x| 
   index = enum.index(x)
   i = (index - lines < 0) ? 0 : index - lines
   j = (index + lines >= enum.length) ? enum.length-1 : index + lines 
   enum[i..j]
 end
 return values.flatten.uniq
end
...