Многострочный негативный взгляд - PullRequest
2 голосов
/ 11 июля 2019

Я не очень хорошо разбираюсь в регулярных выражениях (я работаю над этим часами), и я изо всех сил пытаюсь заменить все пустые строки между 2 идентификаторами ("{|" и "|}")

Myрегулярное выражение выглядит так (извините за ваши глаза): (\{\|)((?:(?!\|\}).)+)(?:\n\n)((?:(?!\|\}).)+)(\|\})

  • (\{\|): символ "{|"
  • ((?:(?!\|\}).)+): все, если не после "|}"(отрицательный взгляд)
  • (?:\n\n): пустая строка, которую я хочу удалить
  • ((?:(?!\|\}).)+): Все, если не после" |} "(отрицательный взгляд)
  • (\|\}): символ "|}"

Демо

Работает, но удаляет только последнюю пустую строку, можете ли вы помочь мне сделатьэто работает со всеми пустыми строками?

Я пытался добавить отрицательный прогноз на \ n \ n с повторяющейся группой на все, но это не сработало.

Ответы [ 3 ]

3 голосов
/ 11 июля 2019

Несколько способов:

Шаблон на основе \G: (необходим только один шаблон)

$txt = preg_replace('~ (?: \G (?!\A) | \Q{|\E ) [^|\n]*+ (?s: (?! \Q|}\E | \n\n) . [^|\n]*)*+ \n \K \n+ ~x', '', $txt);

\G соответствует началу строки или позиции встрока после последнего успешного совпадения.Это обеспечивает совпадение нескольких совпадений.

То, что я называю шаблоном \G * , может быть схематизировано следующим образом:

(?: \G position after a successful match | first match beginning ) reach the target \K target

"достичь цели" частьразработан, чтобы никогда не соответствовать закрывающей последовательности |}.Таким образом, как только будет найдена последняя цель, часть \G потерпит неудачу, пока первая совпадающая часть снова не удастся.

~ 
### The beginning
(?:
    \G (?!\A) # contigous to a successful match
  |
    \Q{|\E # opening sequence
           #; note that you can add `[^{]* (*SKIP)` before to quickly avoid 
           #; all failing positions

           #; note that if you want to check that the opening sequence is followed by 
           #; a closing sequence (without an other opening sequence), you can do it
           #; here using a lookahead
)

### lets reach the target
#; note that all this part can also be written like that `(?s:(?!\|}|\n\n).)*`
#; or `(?s:[^|\n]|(?!\|}|\n\n).)*`, but I choosed the unrolled pattern that is
#; more efficient.

[^|\n]*+ # all that isn't a pipe or a newline

# eventually a character that isn't the start of |} or \n\n
(?s:   
    (?! \Q|}\E | \n\n ) # negative lookahead
    . # the character
    [^|\n]*
)*+
#; adding a `(*SKIP)` here can also be usefull if there's no more empty lines
#; until the closing sequence

### The target

\n \K \n+ # the \K is a conveniant way to define the start of the returned match
          # result, this way, only \n+ is replaced (with nothing)
~x

или preg_replace_callback: (более просто)

$txt = preg_replace_callback('~\Q{|\E .*? \Q|}\E~sx', function ($m) {
    return preg_replace('~\n+~', "\n", $m[0]);
}, $txt);

демонстрации

2 голосов
/ 11 июля 2019

Вы можете использовать шаблон положительного просмотра, чтобы убедиться, что за соответствующей пустой строкой следует |}, а также использовать шаблон отрицательного просмотра, чтобы убедиться, что ни один из символов между пустой строкой и |} не является начальнымположение {|:

\n{2,}(?=(?:(?!\{\|).)*?\|\})

Демо: https://regex101.com/r/oWfkg1/8

1 голос
/ 11 июля 2019

Если вы используете:

(?<={\|)(\n{2,}|(\r\n){2,}|\s+)(?=\|})

Тогда оно будет соответствовать новым строкам и пустому пространству, найденному между {| и |}

...