Я пытаюсь создать безопасное расширение Chrome для веб-сканирования, которое сравнивает текст веб-статьи, и одним из компонентов анализа текста является сравнение текстов с веб-сайтов с исходным текстом (который является внутренним текстом текущей вкладки в Chrome) вДля того, чтобы создать отчет о сходстве.Однако я не знаю, как получить текст из HTTP-запроса, и я хотел бы знать, возможно ли это (я провел обширный поиск в Интернете и не могу найти аналогичный вариант использования), например, как вы могли бы увидеть из document.body.innerText.
const Http = new XMLHttpRequest();
Http.open("GET", tempURL);
Http.send();
Http.onreadystatechange=(e)=>{
urlResult = Http.responseText;
console.log(urlResult)
}
TempURL - это веб-страница, с которой я хочу получить внутренний текст.
Очевидно, что возвращаемые данные в журнале - это весь текст HTML.
Я также искал, чтобы увидеть, есть ли какие-либо API (например, textise), которые могли бы сделать это для меня, но не играли в кости.
РЕДАКТИРОВАТЬ: Попытка загрузки в поддельный div и iframe безуспешно.Форматирование Regex не работает должным образом, и также попробовал одно из решений здесь: https://stackoverflow.com/a/12943036/4867966 (код, который я использовал ниже):
const Http = new XMLHttpRequest();
Http.open("GET", tempArray[x]);
Http.send();
Http.onreadystatechange=(e)=>{
urlResult = Http.responseText;
var temp = document.createElement("div");
temp.innerHTML = urlResult;
urlResult = temp.textContent || temp.innerText;
console.log(urlResult)
}
Все, что я получаю от попытки выше (используя новостиURL статьи) (образец):
Ethiopian Airlines crash: Flight Et302 crashes near Addis Ababa, killing 157 - CNN{"@context": "http://schema.org/", "@type": "WebPage","name": "No survivors in Ethiopian Airlines Boeing 737 crash near Addis Ababa", "speakable": {"@type": "SpeakableSpecification","cssSelector": [".pg-headline", ".speakable"]}, "url": "https://www.cnn.com/2019/03/10/africa/ethiopia-airline-crash-nairobi-intl/index.html"}@charset "UTF-8";.zn.t-hidden{display:none!important}.m-legal .m-legal__links[data-analytics=footer_adchoices]:after{content:"";display:block;margin:0;padding:0}h1 a,h2 a,h3 a,h4 a,h5 a,h6 a{color:inherit;text-decoration:none}h1 a:visited,h2 a:visited,h3 a:visited,h4 a:visited,h5 a:visited,h6 a:visited{color:inherit}h1 a:hover,h2 a:hover,h3 a:hover,h4 a:hover,h5 a:hover,h6 a:hover{text-decoration:none}.pg.t-dark h1 a:hover,.pg.t-dark h2 a:hover,.pg.t-dark h3 a:hover,.pg.t-dark h4 a:hover,.pg.t-dark h5 a:hover,.pg.t-dark h6 a:hover,.pg.t-light h1 a:hover,.pg.t-light h2 a:hover,.pg.t-light h3 a:hover,.pg.t-light h4 a:hover,.pg.t-light h5 a:hover,.pg.t-light h6 a:hover,.pg .zn.t-dark h1 a:hover,.pg .zn.t-dark h2 a:hover,.pg .zn.t-dark h3 a:hover,.pg .zn.t-dark h4 a:hover,.pg .zn.t-dark h5 a:hover,.pg .zn.t-dark h6 a:hover,.pg .zn.t-light h1 a:hover,.pg .zn.t-light h2 a:hover,.pg .zn.t-light h3 a:hover,.pg .zn.t-light h4 a:hover,.pg .zn.t-light h5 a:hover,.pg .zn.t-light h6 a:hover,h1 .pg.t-dark a:hover,h1 .pg.t-light a:hover,h1 .pg .zn.t-dark a:hover,h1 .pg .zn.t-light a:hover,h2 .pg.t-dark a:hover,h2 .pg.t-light a:hover,h2 .pg .zn.t-dark a:hover,h2 .pg .zn.t-light a:hover,h3 .pg.t-dark a:hover,h3 .pg.t-light a:hover,h3 .pg .zn.t-dark a:hover,h3 .pg .zn.t-light a:hover,h4 .pg.t-dark a:hover,h4 .pg.t-light a:hover,h4 .pg .zn.t-dark a:hover,h4 .pg .zn.t-light a:hover,h5 .pg.t-dark a:hover,h5 .pg.t-light a:hover,h5 .pg .zn.t-dark a:hover,h5 .pg .zn.t-light a:hover,h6 .pg.t-dark a:hover,h6 .pg.t-light a:hover,h6 .pg .zn.t-dark a:hover,h6 .pg .zn.t-light a:hover{color:#c00}.el__storyhighlights__list{list-
Любая помощь с благодарностью.