Я не могу говорить о законности вашей задачи, но есть несколько способов сделать это. Хотя я не силен в XPath, это может быть лучшим способом. Я считаю, что вы можете использовать пакет XML для получения содержимого страницы и использовать XPath для извлечения данных нужных вам элементов.
Например, я использую Chrome для браузера, и когда я осматривал страницу с помощью Инструментов разработчика, там действительно была структура страницы с данными, «скрытыми» внутри различных тегов, которые вы сможете использовать. действительно легко с помощью XPath.
Проверьте эту ссылку для примера использования XPath.
HTH и удачи