rvest
может очищать только stati c HTML контент.
Большинство современных коммерческих веб-сайтов используют динамический c веб-контент, генерируемый на лету JavaScript.
Чтобы очистить такие веб-сайты, вам сначала нужно заставить сайт генерировать HTML контент, который вы ищете, а затем вы сможете очистить его с помощью rvest
.
Чтобы сделать поэтому вам нужно использовать RSelenium , который имитирует браузер и позволяет вам перемещаться по сайту программно.
RSelenium требует установки Docker Selenium server .
В конце этого долгого и интересного путешествия вам придется проявить изобретательность, чтобы веб-сайт не подумал, что его запрашивает робот: