HtmlUnit WebClient getPage ("URL") занимает больше часа на моей виртуальной машине - PullRequest
0 голосов
/ 11 февраля 2019

Следующий код занимает более часа на моей гостевой виртуальной коробке Ubuntu 18.04, работающей на хосте Windows 10.
System.getProperties().put("org.apache.commons.logging.simplelog.defaultlog", "fatal"); final WebClient webClient = new WebClient();<br> webClient.getOptions().setCssEnabled(false);<br> webClient.getOptions().setThrowExceptionOnScriptError(false); webClient.setRefreshHandler(new RefreshHandler() { public void handleRefresh(Page page, URL url, int arg) throws IOException { System.out.println("handleRefresh"); } }); HtmlPage page = (HtmlPage) webClient.getPage("https://www.mohavecounty.us/ContentPage.aspx?id=111&cid=869&parcel=10272001");

Моей виртуальной машине было выделено 10 ГБ ОЗУ (из 16ГБ оперативной памяти моего ноутбука), 128 МБ видеопамяти и работает на игровом ноутбуке Alienware, который я купил три года назад.Другая часть моего кода (не опубликованная выше) обрабатывает другую веб-страницу с другого веб-сайта, которая включает JavaScript, примерно за минуту или две.

Я подозреваю следующее: когда вы переходите по URL-адресу в коде, загрузка страницы занимает всего несколько секунд.Но синяя кнопка «Поиск» показывает сигнал «занято» даже через полтора часа.Я подозреваю, что JavaScript страницы вошел в некоторый бесконечный цикл, который заставляет код полагать, что страница все еще загружается, пока она не потеряет терпение через час.

Я хотел бы сократить это время с часа доменее 30 минут на одной виртуальной машине.Есть идеи, как этого добиться?

...