Как получить все результаты с веб-страницы, как показывает браузер, когда прокручивает страницу вниз - PullRequest
0 голосов
/ 30 апреля 2019

Я пытаюсь получить все результаты видео с веб-страницы:

$ curl -qs https://ok.ru/video/c335170 | pup '.video-card_lk attr{href}' | wc -l
24

Другой метод возвращает тот же результат:

$ wget --config="/dev/null" -qO- https://ok.ru/video/c335170 | grep -oP '/video/\d+' | sort -u | wc -l
24

РЕДАКТИРОВАТЬ 1: прокрутить веб-страницу до конца с помощью Firefox и сохранить его как c335170.html, и я получаю тот же результат:

$ cat c335170.html | grep -oP '/video/\d+' | sort -u | wc -l
24

Однако в веб-браузере после прокрутки до конца отображается 81 результат.

То же pb. с YouTube и кнопкой «Загрузить еще», которая скрывает результаты от клиентов консоли http:

$ curl -qs https://www.youtube.com/user/impacttvouaga/videos | grep -oP "/watch\?v=[\w-]+" | uniq | wc -l
21

РЕДАКТИРОВАТЬ 2: Я только что сохранил эту веб-страницу с Firefox как «Веб-страница, только HTML» в RMC_IMPACTV__YouTube.html, а затем:

$ cat RMC_IMPACTV__YouTube.html | grep -oP "/watch\?v=[\w-]+" | uniq | wc -l
21

Как мне получить удаленный HTTP-сервер для выдачи мне всех результатов?

...