Я использую cheerio
для очистки веб-страницы в nodejs
. Теперь я наткнулся на контент в Интернете, который структурирован примерно так:
<div data-content="123456"> ... </div>
<div data-content="142453"> ... </div>
<div data-content="192638"> ... </div>
<div data-content="152701"> ... </div>
<div data-content="172830"> ... </div>
обратите внимание, что атрибут data-content
имеет разные значения атрибута, и внутри div есть необходимые данные, которые я хочу очистить. Как я могу использовать cheerio для доступа к атрибутам DOM, которые структурированы следующим образом?
ПРИМЕЧАНИЕ. Я знаю, что использование div
в качестве селектора возможно. Но я не хочу использовать div
как селектор с cheerio. я хочу исключительно использовать data-content
в качестве селектора для доступа к узлам DOM.