Это мое решение:
<?php
// get links
$website = file_get_contents("http://www.example.com"); // download contents of www.example.com
preg_match_all("<a href=\x22(.+?)\x22>", $website, $matches); // save all links \x22 = "
// delete redundant parts
$matches = str_replace("a href=", "", $matches); // remove a href=
$matches = str_replace("\"", "", $matches); // remove "
// output all matches
print_r($matches[1]);
?>
Я рекомендую избегать использования парсеров на основе XML, потому что вы не всегда будете знать,
был ли документ / веб-сайт правильно сформирован.
С наилучшими пожеланиями