Scape данные после входа в систему rvest - PullRequest
1 голос
/ 08 мая 2019

Пожалуйста, помогите мне. Я пытаюсь почистить разделенную таблицу, но на самом деле не могу и не понимаю почему. Это URL: https://www.strava.com/activities/1983801964

Это учетные данные для входа: email=trytest@tiscali.it пароль = 12345678

Это мой код:

pgsession<-html_session("https://www.strava.com/login")

pgform<-html_form(pgsession)[[1]]  

filled_form<-set_values(pgform, email="trytest@tiscali.it", password="12345678")

submit_form(pgsession, filled_form)

page<-jump_to(pgsession, "https://www.strava.com/activities/1983801964")

page%>%html_nodes(xpath='//*[@id="contents"]')

И я получаю {xml_nodeset (0)}

Я попробовал все, также

page%>%html_nodes("body")%>%html_text()

Но я не могу получить эту информацию, пожалуйста, помогите мне !!

Заранее спасибо

1 Ответ

0 голосов
/ 09 мая 2019

Я не могу найти разделенные данные в HTML.Следовательно, может оказаться невозможным очистить сплит от HTML, как это.

Кроме того, вы можете загрузить необработанные данные о деятельности.Ссылка: https://support.strava.com/hc/en-us/articles/216918437-Exporting-your-Data-and-Bulk-Export

Редактировать: вы также можете использовать этот метод для загрузки данных Strava: https://scottpdawson.com/export-strava-workout-data/

Редактировать 2: Разделения содержатся в DIV, называемом "разделением-контейнер".Но исходный HTML-код, вероятно, будет изменен JavaScript после загрузки страницы.Это означает, что вы, вероятно, не сможете очистить данные, не запустив сначала javascript.Надеюсь это поможет.

...