В чем разница между регулярным выражением vim и обычным регулярным выражением? - PullRequest
24 голосов
/ 05 октября 2010

Я заметил, что заменяющее регулярное выражение vim немного отличается от других регулярных выражений. В чем разница между ними?

Ответы [ 5 ]

30 голосов
/ 06 октября 2010

Если под "нормальным регулярным выражением" вы подразумеваете Perl-совместимые регулярные выражения (PCRE), то справка Vim предоставляет хорошую сводку различий между регулярными выражениями Vim и Perl:

:help perl-patterns

Вот что сказано в Vim 7.2:

9. Compare with Perl patterns                           *perl-patterns*

Vim's regexes are most similar to Perl's, in terms of what you can do.  The
difference between them is mostly just notation;  here's a summary of where
they differ:

Capability                      in Vimspeak     in Perlspeak ~
----------------------------------------------------------------
force case insensitivity        \c              (?i)
force case sensitivity          \C              (?-i)
backref-less grouping           \%(atom\)       (?:atom)
conservative quantifiers        \{-n,m}         *?, +?, ??, {}?
0-width match                   atom\@=         (?=atom)
0-width non-match               atom\@!         (?!atom)
0-width preceding match         atom\@<=        (?<=atom)
0-width preceding non-match     atom\@<!        (?!atom)
match without retry             atom\@>         (?>atom)

Vim and Perl handle newline characters inside a string a bit differently:

In Perl, ^ and $ only match at the very beginning and end of the text,
by default, but you can set the 'm' flag, which lets them match at
embedded newlines as well.  You can also set the 's' flag, which causes
a . to match newlines as well.  (Both these flags can be changed inside
a pattern using the same syntax used for the i flag above, BTW.)

On the other hand, Vim's ^ and $ always match at embedded newlines, and
you get two separate atoms, \%^ and \%$, which only match at the very
start and end of the text, respectively.  Vim solves the second problem
by giving you the \_ "modifier":  put it in front of a . or a character
class, and they will match newlines as well.

Finally, these constructs are unique to Perl:
- execution of arbitrary code in the regex:  (?{perl code})
- conditional expressions:  (?(condition)true-expr|false-expr)

...and these are unique to Vim:
- changing the magic-ness of a pattern:  \v \V \m \M
   (very useful for avoiding backslashitis)
- sequence of optionally matching atoms:  \%[atoms]
- \& (which is to \| what "and" is to "or";  it forces several branches
   to match at one spot)
- matching lines/columns by number:  \%5l \%5c \%5v
- setting the start and end of the match:  \zs \ze
22 голосов
/ 13 февраля 2013

«Регулярное выражение» действительно определяет алгоритмы, а не синтаксис.Это означает, что разные разновидности регулярных выражений будут использовать разные символы для обозначения одного и того же;или они будут ставить перед некоторыми специальными символами обратную косую черту, а другие нет.Как правило, они все равно будут работать одинаково.

Когда-то POSIX определял синтаксис Basic Regular Expression (BRE), которому в основном следует Vim.Вскоре после этого было также выпущено предложение синтаксиса расширенного регулярного выражения (ERE).Основное различие между ними состоит в том, что BRE имеет тенденцию обрабатывать больше символов как литералы - «а» - это «а», но также «(» - это «(», а не специальный символ), и поэтому включает в себя больше обратной косой черты вдать им «особое» значение.

Обсуждение сложных различий между Vim и Perl в отдельном комментарии здесь полезно, но также стоит упомянуть несколько простых способов, которыми регулярные выражения Vim отличаются от «принятых».«норма (под которой вы, вероятно, подразумеваете Perl.) Как уже упоминалось выше, они в основном отличаются по использованию предыдущего обратного слеша.

Вот несколько очевидных примеров:

Perl    Vim     Explanation
---------------------------
x?      x\=     Match 0 or 1 of x
x+      x\+     Match 1 or more of x
(xyz)   \(xyz\) Use brackets to group matches
x{n,m}  x\{n,m} Match n to m of x
x*?     x\{-}   Match 0 or 1 of x, non-greedy
x+?     x\{-1,} Match 1 or more of x, non-greedy
\b      \< \>   Word boundaries
$n      \n      Backreferences for previously grouped matches

Это дает вампредставление о самых важных различиях. Но если вы делаете что-то более сложное, чем основы, я предлагаю вам всегда предполагать, что Vim-regex будет отличаться от Perl-regex или Javascript-regex и обращаться к чему-то вроде Веб-сайт Vim Regex .

4 голосов
/ 28 октября 2014

Попробуйте очень магический режим регулярных выражений Vim. Это ведет себя больше как традиционное регулярное выражение, просто добавьте ваш шаблон с \v. Смотрите :help /\v для получения дополнительной информации. Я люблю это.

3 голосов
/ 12 января 2014

Существует плагин eregex.vim , который переводит из PCRE (Perl-совместимые регулярные выражения) в синтаксис Vim.Чтобы достичь этого перевода, нужно более тысячи строк vim !Я думаю, это также служит точной документацией различий.

3 голосов
/ 05 октября 2010

слишком широкий вопрос. Запустите vim и введите :help pattern.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...