fff.html - это электронное письмо с адресами электронной почты, в некоторых из них есть ссылки на href mailto, а в некоторых нет, я хочу очистить их и вывести в следующем формате
Lorem@ipsum.com,dolor@sit.com,amet@consectetur.com
У меня есть простой скребок, чтобы получить те, которые href связаны, но что-то странное
<?php
$url = "fff.html";
$raw = file_get_contents($url);
$newlines = array("\t","\n","\r","\x20\x20","\0","\x0B");
$content = str_replace($newlines, "", html_entity_decode($raw));
$start = strpos($content,'<a href="mailto:');
$end = strpos($content,'"',$start) + 8;
$mail = substr($content,$start,$end-$start);
print "$mail<br />";
?>
Я должен получить дополнительные очки за оригинальное использование lorem ipsum