`Page.content ()` кукловода всегда в UTF-8 или в кодировке конкретной страницы? - PullRequest
0 голосов
/ 10 мая 2019

Puppeteer's page.content () всегда возвращает строку в UTF-8 или в кодировке для конкретной страницы?

Я видел, что он использует document.documentElement.outerHTML внутри ( см. Исходный код ), но не уверен, как это работает.

1 Ответ

0 голосов
/ 10 мая 2019

Погружение в outerHTML документацию :

Чтение значения externalHTML возвращает DOMString , содержащую HTML сериализация элемента и его потомков. Установка значения externalHTML заменяет элемент и всех его потомков новым Дерево DOM, созданное путем анализа указанной строки htmlString.

Погружение в DOMString документацию :

DOMString является UTF-16 String. Так как JavaScript уже использует такие строки, DOMString отображается непосредственно в строку.

Так что, похоже, здесь кончается тайна.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...