Шаги:
- найти последнее сообщение / текст в текущем представлении.
- выполнить прокрутку вниз по последнему сообщению, чтобы вызвать «загрузить дополнительные данные»
Дополнительная информация:
Вы можете просто сделать document.querySelectorAll('#CatNewsList > div').length
Результатом будет количество сообщений. Выполните итерацию по каждому сообщению и извлеките URL:
Селектор CSS:
# CatNewsList> div .news_img> a
Теперь вы можете получить тег'href' и извлеките ссылку.
Когда вы дойдете до последнего сообщения, выполните прокрутку до конца и дождитесь, пока элемент с XPATH: //p[text()='loading more news... ']
не станет ВИДИМЫМ.
Как этоВы уверены, что страница не загружает ничего нового. Сохраните предыдущий размер сообщений и начните анализировать его до следующей длины сообщений.
Повтор.