все решения, описанные выше, которые я пробовал в прошлом в течение длительного периода времени (особенно Celerity), но я пришел к выводу, что все они ужасны и имеют серьезные недостатки, которые делают жизнь очень трудной, поскольку они основаны на одном и том же HtmlUnit движок для обработки Javascript.
Celerity - это не инструмент для очистки экрана, его не хватает в Windows Management, и он основан на движке HTMLUNIT, который совсем не хорош в работе с Javascript. Тем не менее, он работает быстро для сайтов, использующих минимальный или средний уровень запросов Javascript и AJAX. Он основан на рубине, который станет облегчением для тех, кто не любит Java.
Лучше всего использовать Selenium WebDriver API. Это требует отображения X на вашем Linux-сервере, и это медленнее, чем HtmlUnit, но это не доставит вам проблем, связанных с использованием чего-либо производного или переноса HtmlUnit. Существует возможность использовать HtmlUnit, но вы жертвуете точностью, постоянством и скоростью. HtmlUnit намного быстрее для очистки.
Тем не менее, скорость всегда плохая, если вы удаляете другие сайты, которые вам не принадлежат, так как обычно это требует запрета IP.
Мой личный совет: держитесь подальше от всего, что использует движок HtmlUnit, и используйте Selenium, который напрямую управляет браузером по вашему выбору для максимальной точности и надежности.