strip_tags()
удаляет HTML из значения переменной. Второй параметр полезен, если вы хотите сделать исключения и оставить определенные теги, например тег p
aragraph.
$text = '<p>Paragraph.</p> <!-- boo --> <a href="#">Other text</a>';
echo strip_tags($text); // Paragraph. Other text
echo strip_tags($text, '<p><a>'); // <p>Paragraph.</p> <a href="#">Other text</a>
phpQuery
Если вы хотите избежать регулярных выражений, вы можете использовать phpQuery для обработки значения, а затем использовать селекторы и методы в стиле jQuery для получения значения:
// Bring in phpQuery
require("phpQuery-onefile.php");
// Load up our HTML
phpQuery::newDocumentHTML("<a href='http://sampsonresume.com/'>Homepage</a>");
// Print the HREF attribute of the first Anchor
print pq("a:first")->attr("href"); // http://sampsonresume.com/
Regex
Для поиска URL можно использовать следующее:
$var = "<a href='http://sampsonresume.com/'>Homepage</a>";
preg_match("(https?://([-\w\.]+)+(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?)",$var,$match);
print $match[0]; // http://sampsonresume.com/