Я пытаюсь найти существующие подкаталоги на том же сервере, что и указанный сайт, используя PHP.Например, при разборе домашней страницы seoguru.nl мне хотелось бы иметь массив, подобный следующему:
Array
(
[0] => 'styles'
[1] => 'scripts'
[2] => 'images'
)
(это все каталоги, на которые ссылается источник HTML)
Я думал о двух способах сделать это, первый - использовать довольно продвинутое регулярное выражение, но мои знания о регулярных выражениях еще далеко ... Второй - использовать класс парсера HTML, такой как DOMDocument, но яНе знаю, как именно это сделать.
Другая проблема заключается в том, что внешние сайты, например CDN или просто ссылки на другие сайты, должны быть исключены, но я думаю, что я могу отфильтровать их потом.1009 * Если вам нужна дополнительная информация, пожалуйста, спросите!