Как убрать неправильное вложение тегов BBcode с помощью PHP - PullRequest
1 голос
/ 26 марта 2011

По некоторым причинам я получил следующий неправильно вложенный BBcode

[url =] Hello [url =] world [/ url] [/ url]

Я просто хочу удалить вложенныйURL-теги.Результат должен быть: [url =] Hello world [/ url]

У меня очень длинная статья, и это случается много раз.Любые предложения для этого?


Как удалить вложенные теги много раз в одной статье, как это

[url =] Hello [url =] world [/ url] [/url] [url =] Привет [url =] мир [/ url] [/ url] [url =] Привет [url =] мир [/ url] [/ url]

Спасибо!

Ответы [ 2 ]

1 голос
/ 26 марта 2011

Следующий проверенный скрипт должен сделать свое дело.Он использует рекурсивное регулярное выражение и рекурсивное приложение preg_replace_callback().Он будет обрабатывать теги URL на любом вложенном уровне и удаляет все теги, кроме самых внешних:

<?php // test.php 20110325_1500
$re_url = '%# Match outermost [URL=...]...[/URL] (may have nested URL tags
    (\[URL\b[^[\]]*+\])       # $1: opening URL tag.
    (                         # $2: Contents of URL tag.
      (?:                     # Group of contents alternatives.
        (?:(?!\[/?URL\b).)++  # One or more non-"[URL", non-"[/URL"
      | (?R)                  # Or recursively match nested [URL]..[/URL].
      )*+                     # Zero or more contents alternatives.
    )                         # End $2: Contents of URL tag.
    (\[/URL\s*+\])            # $3: Outermost closing [/URL]
    %six';
function strip_nested_url_tags($text) {
    global $re_url;
    $return = '_handle_url_callback';
    return preg_replace_callback($re_url, $return, $text);
}
function _handle_url_callback($matches) {
    global $re_url;
    static $depth = 0;
    $depth++;
    $return = '_handle_url_callback';
    $matches[2] = preg_replace_callback($re_url, $return, $matches[2]);
    if ($matches[2] === NULL)
    { // On error, preg_replace_callback returns NULL.
        exit('Error - Message is too long or too complex.');
    }
    if (--$depth > 0) return $matches[2];
    return $matches[1] . $matches[2] . $matches[3];
}
$data = file_get_contents('testdata.html');
$data = strip_nested_url_tags($data);
file_put_contents('testdata_out.html', $data);
?>
0 голосов
/ 26 марта 2011

Это может сработать:

$string = preg_replace("/(\[url=[^\]]*\].*)\[url=[^\]]*\](.*)\[\/url\](.*\[\/url\])/is", "$1$2$3", $string);

Вы должны найти корень проблемы, а не пытаться ее устранить.

...