В прошлом мне нужна была похожая функция.Что вы можете сделать, это использовать MySQL для хранения ваших ссылок.
В моем случае у меня была таблица todo и таблица pages .Заполните таблицу todo некоторыми URL-адресами, которые вы хотите найти.
Я привык получать информацию о странице, которая мне нужна (открытый текст и заголовок), и сохранять ее в базе данных MySQL1011 * страниц .Затем я перебирал ссылки и добавлял их в таблицу todo .Последний шаг состоял в том, чтобы удалить текущую страницу из моего списка задач, а затем повторить цикл ..
grab a url from todo loop
{
get current page title and plaintext store it in pages table
loop through links Add found links to todo table
remove current page from todo
}