PHP strip_tags Проверка HTML и проверка скобок? - PullRequest
0 голосов
/ 31 января 2019

В настоящее время я использую тег strip_tags($content, '<a>') для очистки тегов html, кроме тега <a>.

Пример 1: Example "lorem ipsum dolor <sit amet....." он обрезает все после "<"

Пример2: Если содержимое начинается с "<test lorem ipsum", я получаю только пустую строку.

Я пытался проверить это с помощью регулярных выражений, но результат тот же.

preg_replace('/<[^>]*>/', '', $content) возвращает тот же результатдля проверки.

Мне нужно как-то очистить html и сохранить правильное использование скобки "<" внутри содержимого.

1 Ответ

0 голосов
/ 31 января 2019

Если вы хотите очистить все теги, кроме простого <a> и </a>, вы можете просто отфильтровать их, заменить их, затем очистить HTML и заменить их обратно, как показано ниже:

<?php
    $text = "<a> ahahahasjusjhcbzdeu <div>JEY ssjisuj</div>jn<p> here somehing else </p></a>";

    $EndText = str_replace("<a>", "&ATL", $text);
    $EndText = str_replace("</a>", "&ATR", $EndText);

    $EndText = strip_tags($EndText);

    $EndText = str_replace("&ATL", "<a>", $EndText);
    $EndText = str_replace("&ATR", "</a>", $EndText);

    echo htmlspecialchars($EndText);
?>

Но если вы хотите получить что-то вроде <a href="mywebsite.com"> here </a>, ссылка тоже будет удалена.
Поэтому вам нужно отфильтровать текст между <a и > (это можно сделать с помощью explode, sub_str и str_replace), затем сделайте то же самое, что и в приведенном выше решении, а затем вставьте его снова.
Код, который сделает это:

<?php
    $text = "<a>Here something</a><div>Again<a href='website.com'>That's a better link</a> Here</div>";

    $Texts = explode("<a", $text);
    $Begin = strip_tags(array_shift($Texts));
    $Middles = [];
    foreach ($Texts as &$value) {
        $Middle = explode(">", $value)[0];
        array_push($Middles, $Middle);

        $Position = strpos($value, ">");
        $value = substr($value, $Position+1);
        $value = str_replace("</a>", "&htlENDA&", $value);
        $value = strip_tags($value);

    }

    $EndText = $Begin;

    for ($i = 0; $i < count($Texts); $i++) {
        $EndText = $EndText."<a".$Middles[$i].">".$Texts[$i];
    }

    $EndText = str_replace("&htlENDA&", "</a>", $EndText);

    echo "<br><br>Ende: ".htmlspecialchars($EndText);

?>

Это решит вашу проблему,поскольку он удаляет каждый HTML-тег, кроме <a ... > и </a>

...