Получение innerText HTTP GET-запроса с использованием URL в простой JS? - PullRequest
0 голосов
/ 11 марта 2019

Я пытаюсь создать безопасное расширение Chrome для веб-сканирования, которое сравнивает текст веб-статьи, и одним из компонентов анализа текста является сравнение текстов с веб-сайтов с исходным текстом (который является внутренним текстом текущей вкладки в Chrome) вДля того, чтобы создать отчет о сходстве.Однако я не знаю, как получить текст из HTTP-запроса, и я хотел бы знать, возможно ли это (я провел обширный поиск в Интернете и не могу найти аналогичный вариант использования), например, как вы могли бы увидеть из document.body.innerText.

const Http = new XMLHttpRequest();
        Http.open("GET", tempURL);
        Http.send();
        Http.onreadystatechange=(e)=>{


            urlResult = Http.responseText;

            console.log(urlResult)
        }

TempURL - это веб-страница, с которой я хочу получить внутренний текст.

Очевидно, что возвращаемые данные в журнале - это весь текст HTML.

Я также искал, чтобы увидеть, есть ли какие-либо API (например, textise), которые могли бы сделать это для меня, но не играли в кости.

РЕДАКТИРОВАТЬ: Попытка загрузки в поддельный div и iframe безуспешно.Форматирование Regex не работает должным образом, и также попробовал одно из решений здесь: https://stackoverflow.com/a/12943036/4867966 (код, который я использовал ниже):

        const Http = new XMLHttpRequest();
        Http.open("GET", tempArray[x]);
        Http.send();
        Http.onreadystatechange=(e)=>{


            urlResult = Http.responseText;
            var temp = document.createElement("div");
            temp.innerHTML = urlResult;
            urlResult = temp.textContent || temp.innerText;
            console.log(urlResult)

        }

Все, что я получаю от попытки выше (используя новостиURL статьи) (образец):

Ethiopian Airlines crash: Flight Et302 crashes near Addis Ababa, killing 157 - CNN{"@context": "http://schema.org/", "@type": "WebPage","name": "No survivors in Ethiopian Airlines Boeing 737 crash near Addis Ababa", "speakable": {"@type": "SpeakableSpecification","cssSelector": [".pg-headline", ".speakable"]}, "url": "https://www.cnn.com/2019/03/10/africa/ethiopia-airline-crash-nairobi-intl/index.html"}@charset "UTF-8";.zn.t-hidden{display:none!important}.m-legal .m-legal__links[data-analytics=footer_adchoices]:after{content:"";display:block;margin:0;padding:0}h1 a,h2 a,h3 a,h4 a,h5 a,h6 a{color:inherit;text-decoration:none}h1 a:visited,h2 a:visited,h3 a:visited,h4 a:visited,h5 a:visited,h6 a:visited{color:inherit}h1 a:hover,h2 a:hover,h3 a:hover,h4 a:hover,h5 a:hover,h6 a:hover{text-decoration:none}.pg.t-dark h1 a:hover,.pg.t-dark h2 a:hover,.pg.t-dark h3 a:hover,.pg.t-dark h4 a:hover,.pg.t-dark h5 a:hover,.pg.t-dark h6 a:hover,.pg.t-light h1 a:hover,.pg.t-light h2 a:hover,.pg.t-light h3 a:hover,.pg.t-light h4 a:hover,.pg.t-light h5 a:hover,.pg.t-light h6 a:hover,.pg .zn.t-dark h1 a:hover,.pg .zn.t-dark h2 a:hover,.pg .zn.t-dark h3 a:hover,.pg .zn.t-dark h4 a:hover,.pg .zn.t-dark h5 a:hover,.pg .zn.t-dark h6 a:hover,.pg .zn.t-light h1 a:hover,.pg .zn.t-light h2 a:hover,.pg .zn.t-light h3 a:hover,.pg .zn.t-light h4 a:hover,.pg .zn.t-light h5 a:hover,.pg .zn.t-light h6 a:hover,h1 .pg.t-dark a:hover,h1 .pg.t-light a:hover,h1 .pg .zn.t-dark a:hover,h1 .pg .zn.t-light a:hover,h2 .pg.t-dark a:hover,h2 .pg.t-light a:hover,h2 .pg .zn.t-dark a:hover,h2 .pg .zn.t-light a:hover,h3 .pg.t-dark a:hover,h3 .pg.t-light a:hover,h3 .pg .zn.t-dark a:hover,h3 .pg .zn.t-light a:hover,h4 .pg.t-dark a:hover,h4 .pg.t-light a:hover,h4 .pg .zn.t-dark a:hover,h4 .pg .zn.t-light a:hover,h5 .pg.t-dark a:hover,h5 .pg.t-light a:hover,h5 .pg .zn.t-dark a:hover,h5 .pg .zn.t-light a:hover,h6 .pg.t-dark a:hover,h6 .pg.t-light a:hover,h6 .pg .zn.t-dark a:hover,h6 .pg .zn.t-light a:hover{color:#c00}.el__storyhighlights__list{list-

Любая помощь с благодарностью.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...