Я использую HtmlUnit для выполнения некоторого Javascript в файле HTML.Дело в том, что Javascript может быть чем угодно, например, document.querySelector()
.
. При запуске от document.querySelector()
до executeJavaScript()
для получения строковых данных из HTML, он искажает кодировку.
Например: Interés
становится Interés
.
Есть ли умный способ преобразовать его, конфигурируя объекты HtmlUnit?
Некоторый код:
webClient = new WebClient(BrowserVersion.CHROME);
webClient.getOptions().setThrowExceptionOnScriptError(false);
webClient.getOptions().setCssEnabled(false);
webClient.getOptions().setAppletEnabled(false);
webClient.getOptions().setDownloadImages(false);
htmlPage = this.webClient.getPage("file:/" + htmlFile.getAbsolutePath());
ScriptResult scriptResult = htmlPage.executeJavaScript(someJavascriptFunction);
//This scriptResult.getJavaScriptResult() already has encoding issues
У меня естьпопытался установить webClient.addRequestHeader("Accept-Encoding", "utf-8");
, но это не работает.