Как я могу получить три параметра из строки, используя preg_match_all? - PullRequest
3 голосов
/ 13 марта 2019

Я пытаюсь получить из текста все вхождения фрагмента кода и 3 параметра. Я делаю это, используя регулярное выражение и preg_match_all PHP-функцию.

Это прекрасно работает, если в тексте присутствует только один фрагмент кода. Если их два или более, я получаю странный результат.

Я не очень разбираюсь в регулярных выражениях, поэтому мне сложно понять, чего мне не хватает.

Функция

public function getGallerySnippetOccurrences($text) {

    $ptn = '/{# +gallery +(src|width|height)=\[(.*)\] +(src|width|height)=\[(.*)\] +(src|width|height)=\[(.*)\] +#}/';

    if(preg_match_all($ptn,$text,$matches)){
        $turnedMatches = $this->turn_array($matches);
        return $turnedMatches;
    }
    else {
        return null;
    }
}

Текст 1 (в данном случае работает как указано)

Lorem ipsum {# gallery src=[holiday_images/london] width=[400] height=[300] #} sid amet.

Возвращает:

array(1) {
  [0] =>
  array(7) {
    [0] =>
    string(66) "{# gallery src=[holiday_images/london] width=[400] height=[300] #}"
    [1] =>
    string(3) "src"
    [2] =>
    string(21) "holiday_images/london"
    [3] =>
    string(5) "width"
    [4] =>
    string(3) "400"
    [5] =>
    string(6) "height"
    [6] =>
    string(3) "300"
  }
}

Текст 2 (непредвиденное поведение)

Lorem ipsum {# gallery src=[holiday_images/london] width=[400] height=[300] #} sid amet {# gallery src=[holiday_images/paris] width=[400] height=[300] #}

Возвращает

array(1) {
  [0] =>
  array(7) {
    [0] =>
    string(141) "{# gallery src=[holiday_images/london] width=[400] height=[300] #} sid amet {# gallery src=[holiday_images/paris] width=[400] height=[300] #}"
    [1] =>
    string(3) "src"
    [2] =>
    string(96) "holiday_images/london] width=[400] height=[300] #} sid amet {# gallery src=[holiday_images/paris"
    [3] =>
    string(5) "width"
    [4] =>
    string(3) "400"
    [5] =>
    string(6) "height"
    [6] =>
    string(3) "300"
  }
}

Что я делаю не так?

Ответы [ 2 ]

2 голосов
/ 13 марта 2019

В вашем шаблоне вы используете жадные совпадения с использованием (. ), которые должны быть заменены не жадным шаблоном (. ?).Пожалуйста, найдите образец ниже

$ptn = '/{# +gallery +(src|width|height)=\[(.*?)\] +(src|width|height)=\[(.*?)\] +(src|width|height)=\[(.*?)\] +#}/';
1 голос
/ 13 марта 2019

Как указано в моем комментарии ниже, ваш ответ о том, что если сделать квантификатор не жадным, он заработает. Однако это все еще оставляет ваше регулярное выражение повторяющимся и неэффективным.

Вы можете рассмотреть этот подход для обоих пунктов:

$re = '/{\#
\h+gallery
\h+(src|width|height)=\[([^]]*)]
\h+((?1))=\[([^]]*)]
\h+((?1))=\[([^]]*)]
\h*\#}/x';

preg_match_all($re, $str, $matches, PREG_SET_ORDER, 0);

// Print the entire match result
var_dump($matches); 

RegEx Demo

  • Обратите внимание, как это регулярное выражение определяет подшаблон и повторно использует его по всему регулярному выражению, используя (?1), чтобы избежать повторений
  • Также обратите внимание на использование более эффективного отрицательного класса [^]]* вместо неэффективного .*? для захвата значений.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...