Я пытаюсь очистить таблицу от этой страницы. В таблице около 400 строк, из которых только 50 отображаются одновременно.
Исходный код страницы показывает только первые 50 элементов, даже если я открою исходный код, когда последующие элементы отображаются (после нажатия кнопки "Далее"). Фрагмент исходного кода приведен ниже:
50
</td><td>
<span id="cphBody_GridPriceData_Labdistrict_name_49">Bangalore</span>
</td><td>
<span id="cphBody_GridPriceData_LabdMarketName_49">Bangalore</span>
</td><td>
<span id="cphBody_GridPriceData_Labcomm_name_49">Potato</span>
</td><td>
<span id="cphBody_GridPriceData_LabdVariety_49">Local</span>
</td><td>
<span id="cphBody_GridPriceData_LabdVariety_49">FAQ</span>
</td><td>
<span id="cphBody_GridPriceData_LabMinPrice_49">1800</span>
</td><td>
<span id="cphBody_GridPriceData_Labmaxpric_49">1900</span>
</td><td>
<span id="cphBody_GridPriceData_LabModalpric_49">1850</span>
</td><td>
<span id="cphBody_GridPriceData_LabReportedDate_49">06 May 2020</span>
</td>
</tr><tr align="left">
<td colspan="10"><table>
<tr>
<td><input type="image" src="../images/Next.png" alt=">" onclick="javascript:__doPostBack('ctl00$cphBody$GridPriceData','Page$Next');return false;" /></td><td><input type="image" src="../images/Last.png" alt=" >>" onclick="javascript:__doPostBack('ctl00$cphBody$GridPriceData','Page$Last');return false;" /></td>
</tr>
</table></td>
</tr>
</table>
Я не знаю Java, но из Интернета обнаружил, что пакет V8 в R может использоваться для Java отображаемого контента на веб-страницах. Я думаю, что в приведенном выше коде onclick="javascript:__doPostBack('ctl00$cphBody$GridPriceData','Page$Next');return false;
- это та часть, откуда можно получить доступ к следующей части таблицы. Функция __doPostBack
определена выше в исходном коде страницы.
Я удалил таблицу до строки 50 и извлек код функции, используя html_nodes("script")
. Но не удалось получить вызывающую часть функции.
Как мне получить данные со следующих страниц?
Извините за длинный пост.