Очистка элементов React в Ruby с использованием Nokogiri - PullRequest
0 голосов
/ 26 января 2019

Я пытаюсь отсканировать страницу, но часть этой страницы отображается с помощью React.Так что у него есть реагирующие компоненты.Когда я очищаю страницу, я не вижу компоненты реакции и, следовательно, я не могу почистить информацию в этом разделе

, например, в отрендеренном HTML у меня есть раздел, подобный этому

<div id="reactDiv">
  <div data-reactroot="" class="segment">
   <label> Scrape me </label>
  </div>
</div>

Нокаким-то образом, когда я пытаюсь найти css с помощью Nokogiri и делаю это

html_response.css('div#reactDiv')
[#<Nokogiri::XML::Element:0x2ae63e040048 name="div" attributes=[#<Nokogiri::XML::Attr:0x2ae63e040ad4 name="id" value="reactDiv">]>]

В нем нет дочерних элементов, следовательно, я не могу пройти дальше.

У кого-нибудь есть какие-либо другие варианты того, как веб-очистка реагирует на визуализированные html-страницы?

Спасибо

...