Можно ли прочитать содержимое html-страницы и получить <div>с определенным классом? - PullRequest
0 голосов
/ 08 июля 2019

Я использую приложение Nodejs для чтения большой веб-страницы. Содержимое этой веб-страницы читается с помощью API-вызова REST. Как только я получаю контент, меня интересует только конкретный div и все, что под ним. Мне интересно, есть ли какие-нибудь библиотеки nodejs и встроенные возможности javascript, которые я могу использовать, чтобы сделать этот процесс беспроблемным.

Дерево DOM выглядит следующим образом, и я хотел бы прочитать href Показать меня. где внешний / родительский DIV имеет класс = «три равных».

<div class="three-equal" data-layout="three-equal">
  <div class="cell normal" data-type="normal">
    <div class="innerCell">
      <p>
        <span </span>
      </p>
      <div class="panel" ">
        <div </div>
          <div class="panelContent " style="background-color: #ffffff; ">

          </div>
        </div>
        <p>
          <span </span>
        </p>
        <div class="panel " </div>
          <div class="panelContent " style="background-color: #ffffff; ">
            <p>
              <em>
                                                                                                        <a href="/display/reference/ ">Display me</a>
                                                                                                    </em>
            </p>
          </div>
        </div>

      </div>
    </div>
  </div>
</div>
</div>
</div>
</div>

1 Ответ

0 голосов
/ 08 июля 2019

Я бы использовал эту библиотеку обхода / манипуляции с DOM.https://github.com/defunctzombie/dom

Подробнее об использовании здесь: https://github.com/defunctzombie/dom/wiki

...