Как я могу использовать R для очистки данных сайта, которые генерируются методами js / ajax? - PullRequest
0 голосов
/ 18 февраля 2020

В настоящее время я пытаюсь собрать данные избирательного центра с официального сайта выборов в Афганистане в 2018 году. Мне нужно иметь возможность получать данные из каждого из нескольких тысяч отдельных избирательных участков, которые использовались во время выборов.

Это страница с результатами опросов, проведенных в провинции Кабул: http://www.iec.org.af/results_2018/en/home/finalresult_by_pc/1

Ранее я удалил данные с сайта выборов 2010 года в Афганистане, используя инструменты разработчика Chrome, чтобы найти URL-адреса для страниц html, которые сайт загружал через javascript. Это позволило мне получить нужную информацию, используя простой rvest l oop. Веб-сайт 2018 года использует методы Ajax, с которыми я не знаком, и я не могу понять, как извлечь из него нужные мне данные.

Ситуация усложняется, каждый избирательный центр перечисляет только общее количество голосов, поданных за кандидатов, которые отображаются на одной странице результатов, а в некоторых округах есть сотни кандидатов (например: этот снимок экрана 17-ая страница избирательного участка , в которой содержится всего четыре голоса. Для того чтобы получить данные, которые мне нужны, мне нужно будет иметь возможность получать итоги с каждой страницы, чтобы я мог сложить их вместе.

Любая идея о том, как выполнить sh, будет принята с благодарностью.

...