Если я правильно вас понимаю, вы хотите проанализировать содержимое всего веб-сайта (HTML, JS и т. Д.) И создать массив, содержащий все ваши ссылки, а также страницы, которые они можно найти на. Если это правильно, этот код выполнит работу:
<?php
$path = "./path_to_your_files/";
$result = array();
if ( $handle = opendir($path) ) {
while (false !== ($file = readdir($handle))) {
if ($file != "." && $file != "..") {
$contents = file_get_contents($path . $file);
preg_match_all("/a[\s]+[^>]*?href[\s]?=[\s\"\']+"."(.*?)[\"\']+.*?>"."([^<]+|.*?)?<\/a>/", $contents, $parts);
foreach ( $parts[1] as $link ) {
$result[$file][] = $link;
}
}
}
closedir($handle);
}
print_r($result);
?>