Только анализируйте необходимые данные HTML и пропустите ненужные данные HTML - PullRequest
0 голосов
/ 15 октября 2018

Я работаю над сценарием, который получает URL и анализирует весь его HTML.Но он использует только «data-style-name», «href», «data-sold-out» и «select».

. Вот как я анализирую HTML:

function loadHTMLSource(urlSource) {
    xhttp = new XMLHttpRequest();
    xhttp.open("GET", urlSource, false);
    xhttp.send();
    return xhttp.response;
}

var page_html = loadHTMLSource(url); 

parser = new DOMParser();

my_document = parser.parseFromString(page_html, "text/html");

и я только извлекаю информацию из этих HTML-вещей

my_document.querySelectorAll("[data-style-name]");

attributes["data-sold-out"].value

my_document.querySelector("meta[name='csrf-token']");

my_document.querySelector('select');

Можно ли извлечь только эти определенные HTML-вещи.Так что я не получаю данные, которые мне не нужны?

Любая помощь приветствуется.Спасибо.

...