Веб-парсинг страницы с R, требующий нажатия кнопки «показать больше» - PullRequest
0 голосов
/ 13 июля 2020

Я пытаюсь очистить весь контент от Engli sh футбольных матчей премьер-лиги .

Первой попыткой был поиск файла JSON с информацией, но похоже что этот файл недоступен для доступа.

Итак, я пытаюсь получить ссылку на каждое совпадение, чтобы извлечь их данные. Фактически, мне нужен id от каждого объекта из class «event__match event__match - stati c event__match - twoLine». Но у меня две проблемы. Первый - это получение этого идентификатора из совпадений, а второй - наличие кнопки, которую мы должны нажать, чтобы увидеть больше совпадений.

В настоящее время я пробую это:

library(rvest)
library(dplyr)

url <- "https://www.flashscore.com/football/england/premier-league-2018-2019/results/"

url %>%
  read_html() %>%
  html_nodes(".event__match event__match--static event__match--twoLine") %>%
  html_text()

Например, мне нужен список с идентификаторами 380 «g_1_UFOgEYGu», «g_1_tjScDhWo», «g_1_zDR1CCoh» ...

PrintScreen с сайта

...