Я пишу сканер для сайта, который имеет стиль нумерации страниц, подобный этому
Первая |Предыдущая |1 | 2 |3 |4 |5 |Последнее
Теперь все ссылки выше (2 уже нажата, поэтому выделены жирным шрифтом) имеют href = "#", но событие onclick приводит к очень утомительному и непостижимому коду JavaScript.Итак, то, что я подумал об итерациях, которые позволили бы моему сканеру сканировать все страницы, было бы следующим:
- Загрузить начальный URL
- Получить содержимое
Выполнить событие Javascript onclick из кода PHP.Выполните как:
document.getElementById ("идентификатор тега следующей страницы"). Click ();
Приведенное выше загрузит следующую страницу.
вернитесь к шагу (2) и повторяйте до тех пор, пока ссылки на следующей странице не истощатся (например, не будет больше невидимых ссылок, как в прошломслева)
Имеет ли смысл ползать или есть лучшие способы обхода страниц?