PHP: лучший способ извлечь текст в скобках? - PullRequest
66 голосов
/ 13 октября 2008

Какой самый лучший / самый эффективный способ извлечь набор текста между круглыми скобками? Скажем, я хотел получить строку «текст» из строки «игнорировать все, кроме этого (текста)» наиболее эффективным способом.

Пока лучшее, что я придумал, это:

$fullString = "ignore everything except this (text)";
$start = strpos('(', $fullString);
$end = strlen($fullString) - strpos(')', $fullString);

$shortString = substr($fullString, $start, $end);

Есть ли лучший способ сделать это? Я знаю, что использование регулярных выражений обычно менее эффективно, но если я не смогу уменьшить количество вызовов функций, возможно, это будет лучшим подходом? Мысли

Ответы [ 7 ]

114 голосов
/ 13 октября 2008

Я бы просто сделал регулярное выражение и покончил с этим. если вы не выполняете достаточное количество итераций, чтобы это стало огромной проблемой производительности, просто будет проще кодировать (и понимать, когда вы оглядываетесь назад)

$text = 'ignore everything except this (text)';
preg_match('#\((.*?)\)#', $text, $match);
print $match[1];
12 голосов
/ 13 октября 2008

Таким образом, фактически код, который вы разместили, не работает: substr()'s параметры - это $ string, $ start и $ length , а strpos()'s - $haystack, $needle. Слегка изменено:

$str = "ignore everything except this (text)";
$start  = strpos($str, '(');
$end    = strpos($str, ')', $start + 1);
$length = $end - $start;
$result = substr($str, $start + 1, $length - 1);

Некоторые тонкости: я использовал $start + 1 в параметре смещения, чтобы помочь PHP при выполнении поиска strpos() во второй скобке; мы увеличиваем $start one и уменьшаем $length, чтобы исключить скобки из соответствия.

Кроме того, в этом коде нет проверки ошибок: вы должны убедиться, что $start и $end не === false перед выполнением substr.

Что касается использования strpos/substr против регулярного выражения; с точки зрения производительности этот код превзойдет обычное выражение. Это немного сложнее. Я ем и дышу strpos/substr, поэтому я не против этого, но кто-то другой может предпочесть компактность регулярного выражения.

8 голосов
/ 13 октября 2008

Используйте регулярное выражение:

if( preg_match( '!\(([^\)]+)\)!', $text, $match ) )
    $text = $match[1];
3 голосов
/ 29 января 2014

Это пример кода, чтобы извлечь весь текст между '[' и ']' и сохранить его в 2 отдельных массива (т.е. текст внутри круглых скобок в одном массиве и текст вне круглых скобок в другом массиве)

   function extract_text($string)
   {
    $text_outside=array();
    $text_inside=array();
    $t="";
    for($i=0;$i<strlen($string);$i++)
    {
        if($string[$i]=='[')
        {
            $text_outside[]=$t;
            $t="";
            $t1="";
            $i++;
            while($string[$i]!=']')
            {
                $t1.=$string[$i];
                $i++;
            }
            $text_inside[] = $t1;

        }
        else {
            if($string[$i]!=']')
            $t.=$string[$i];
            else {
                continue;
            }

        }
    }
    if($t!="")
    $text_outside[]=$t;

    var_dump($text_outside);
    echo "\n\n";
    var_dump($text_inside);
  }

Выход: extract_text ("привет, как дела?"); будет производить:

array(1) {
  [0]=>
  string(18) "hello how are you?"
}

array(0) {
}

extract_text ("привет [http://www.google.com/test.mp3] как дела?"); будет производить

array(2) {
  [0]=>
  string(6) "hello "
  [1]=>
  string(13) " how are you?"
}


array(1) {
  [0]=>
  string(30) "http://www.google.com/test.mp3"
}
1 голос
/ 02 мая 2017

Эта функция может быть полезна.

    public static function getStringBetween($str,$from,$to, $withFromAndTo = false)
    {
       $sub = substr($str, strpos($str,$from)+strlen($from),strlen($str));
       if ($withFromAndTo)
         return $from . substr($sub,0, strrpos($sub,$to)) . $to;
       else
         return substr($sub,0, strrpos($sub,$to));
    }
    $inputString = "ignore everything except this (text)";
    $outputString = getStringBetween($inputString, '(', ')'));
    echo $outputString; 
    //output will be test

    $outputString = getStringBetween($inputString, '(', ')', true));
    echo $outputString; 
    //output will be (test)

strpos () => которая используется для поиска позиции первого вхождения в строке.

strrpos () => который используется для поиска позиции первого вхождения в строке.

0 голосов
/ 13 мая 2019

Уже опубликованные решения регулярных выражений - \((.*?)\) и \(([^\)]+)\) - не возвращают внутренние строки между открывающими и закрывающими скобками. Если строка Text (abc(xyz 123), они оба возвращают a (abc(xyz 123) в целом, а не (xyz 123).

Шаблон, который соответствует подстрокам (используйте с preg_match для извлечения первого и preg_match_all для извлечения всех вхождений) в круглых скобках без других открывающих и закрывающих скобок между, если совпадение должно включать скобки:

\([^()]*\)

Или вы хотите получить значения без скобок:

\(([^()]*)\)        // get Group 1 values after a successful call to preg_match_all, see code below
\(\K[^()]*(?=\))    // this and the one below get the values without parentheses as whole matches 
(?<=\()[^()]*(?=\)) // less efficient, not recommended

Замените * на +, если между ( и ).

должен быть хотя бы 1 символ.

подробности

  • \( - открывающая круглая скобка (должна быть экранирована для обозначения буквенной круглой скобки, так как она используется вне класса символов)
  • [^()]* - ноль или более символов, отличных от ( и ) (обратите внимание, что ( и ) не нужно экранировать внутри класса символов, как внутри него, ( и ) не могут использоваться для указания группировки и рассматриваются как буквальные скобки)
  • \) - закрывающая круглая скобка (должна быть экранирована для обозначения буквенной круглой скобки, так как она используется вне класса символов).

Часть \(\K в альтернативном регулярном выражении соответствует ( и исключается из значения совпадения (с оператором сброса совпадения \K). (?<=\() является положительным взглядом сзади, который требует, чтобы ( появлялся непосредственно слева от текущего местоположения, но ( не добавляется к значению совпадения, так как паттерны lookbehind (lookaround) не используют. (?=\() - это позитивный прогноз, который требует, чтобы символ ) появлялся сразу справа от текущего местоположения.

PHP код :

$fullString = 'ignore everything except this (text) and (that (text here))';
if (preg_match_all('~\(([^()]*)\)~', $fullString, $matches)) {
    print_r($matches[0]); // Get whole match values
    print_r($matches[1]); // Get Group 1 values
}

Выход:

Array ( [0] => (text)  [1] => (text here) )
Array ( [0] => text    [1] => text here   )
0 голосов
/ 08 апреля 2019
function getStringsBetween($str, $start='[', $end=']', $with_from_to=true){
$arr = [];
$last_pos = 0;
$last_pos = strpos($str, $start, $last_pos);
while ($last_pos !== false) {
    $t = strpos($str, $end, $last_pos);
    $arr[] = ($with_from_to ? $start : '').substr($str, $last_pos + 1, $t - $last_pos - 1).($with_from_to ? $end : '');
    $last_pos = strpos($str, $start, $last_pos+1);
}
return $arr; }

это небольшое улучшение по сравнению с предыдущим ответом, которое возвращает все шаблоны в виде массива:

getStringsBetween ('[T] his [] is [test] string [pattern]') вернет:

...