Веб-удаление таблицы, которая распространяется на страницу «Следующая» (без изменения URL-адреса) в R - PullRequest
0 голосов
/ 08 мая 2020

Я пытаюсь очистить таблицу от этой страницы. В таблице около 400 строк, из которых только 50 отображаются одновременно.

Исходный код страницы показывает только первые 50 элементов, даже если я открою исходный код, когда последующие элементы отображаются (после нажатия кнопки "Далее"). Фрагмент исходного кода приведен ниже:

                                                50
                                        </td><td>
                                <span id="cphBody_GridPriceData_Labdistrict_name_49">Bangalore</span>
                            </td><td>
                                <span id="cphBody_GridPriceData_LabdMarketName_49">Bangalore</span>
                            </td><td>
                                <span id="cphBody_GridPriceData_Labcomm_name_49">Potato</span>
                            </td><td>
                                <span id="cphBody_GridPriceData_LabdVariety_49">Local</span>
                            </td><td>
                                <span id="cphBody_GridPriceData_LabdVariety_49">FAQ</span>
                            </td><td>
                                <span id="cphBody_GridPriceData_LabMinPrice_49">1800</span>
                            </td><td>
                                <span id="cphBody_GridPriceData_Labmaxpric_49">1900</span>
                            </td><td>
                                <span id="cphBody_GridPriceData_LabModalpric_49">1850</span>
                            </td><td>
                                <span id="cphBody_GridPriceData_LabReportedDate_49">06 May 2020</span>
                            </td>
            </tr><tr align="left">
                <td colspan="10"><table>
                    <tr>
                        <td><input type="image" src="../images/Next.png" alt=">" onclick="javascript:__doPostBack(&#39;ctl00$cphBody$GridPriceData&#39;,&#39;Page$Next&#39;);return false;" /></td><td><input type="image" src="../images/Last.png" alt=" >>" onclick="javascript:__doPostBack(&#39;ctl00$cphBody$GridPriceData&#39;,&#39;Page$Last&#39;);return false;" /></td>
                    </tr>
                </table></td>
            </tr>
        </table>

Я не знаю Java, но из Интернета обнаружил, что пакет V8 в R может использоваться для Java отображаемого контента на веб-страницах. Я думаю, что в приведенном выше коде onclick="javascript:__doPostBack(&#39;ctl00$cphBody$GridPriceData&#39;,&#39;Page$Next&#39;);return false; - это та часть, откуда можно получить доступ к следующей части таблицы. Функция __doPostBack определена выше в исходном коде страницы.

Я удалил таблицу до строки 50 и извлек код функции, используя html_nodes("script"). Но не удалось получить вызывающую часть функции.

Как мне получить данные со следующих страниц?

Извините за длинный пост.

...