Как очистить таблицу, которая динамически генерируется Javascript - PullRequest
0 голосов
/ 04 июня 2018

Я новичок в R и пытался извлечь разные данные таблицы с разных веб-сайтов.Мне удалось выполнить базовую очистку данных, но я застрял при попытке извлечь данные из следующей таблицы.

url: https://www.nseindia.com/live_market/dynaContent/live_watch/equities_stock_watch.htm?cat=N

Я пытался использовать html_read & html_nodes функция, использующая css и xpath, но она не возвращает значение.Может ли кто-нибудь посоветовать мне, как действовать?

1 Ответ

0 голосов
/ 04 июня 2018

Таким образом, проблема, с которой вы сталкиваетесь, заключается в том, что rvest будет читать исходный код страницы, но не будет выполнять JavaScript на этой странице.Таблица создается путем выполнения javascript после загрузки источника .

. Лучший вариант - заглянуть в RSelenium.Это связано с тем, что RSelenium фактически запускает и управляет окном браузера, после выполнения JavaScript вы можете запросить текущий источник (что вы увидите, если щелкнуть правой кнопкой мыши в Chrome и выбрать Inspect).

Однако RSelenium был извлечениз CRAN, потому что некоторые зависимости были извлечены из CRAN, поэтому вам, вероятно, потребуется использовать MRAN для его установки.

...