В настоящее время я использую document.documentElement.outerHTML
для получения содержимого html-файла из расширения Google Chrome.
Однако это не оригинальный HTML-код, предоставленный веб-сервером, так как Google Chrome очищает HTML-файл, чтобы он был действительным. XHTML. Например, он преобразует <meta charset="utf-8">
в <meta charset="utf-8" />
. Он также удаляет заголовок <!DOCTYPE html>
, если таковой имеется.
ps: вариант для получения исходного html - перезагрузить его следующим образом. Однако сервер может динамически создать страницу и вернуть другое содержимое (например, если страница содержит текущую временную метку).
content = await fetch(window.location.href, {credentials: 'include'});
Как получить исходный HTML-код, предоставленный веб-сервером?