Я использую библиотеку Puppeteer для очистки некоторых данных с веб-страницы, но она возвращает иногда странные символы. Я уже установил параметры браузера и страницы, как показано ниже. Странная часть этого не происходит всегда. Что может быть причиной этого?
Например, я получил это "چای خونه" вместо "Чайная комната".
//I set these options for the headless browser
args: [
"--no-sandbox",
"--disable-notifications",
"--disable-dev-shm-usage",
"--lang=en-US,en-GB,en"
]
//I set also http 'Accept-Language' header like this way
await page.setExtraHTTPHeaders({
'Accept-Language': 'en-US'
});
// the function grabbing text from an html element
grabElementText(element) {
if (element) {
return element._page.evaluate(el => el.innerText, element);
}
}