Как извлечь текст с помощью cheerio - PullRequest
0 голосов
/ 27 мая 2018

Я пытаюсь удалить текст с сайта NodeJS & Cheerio.Я испробовал множество решений, найденных в Интернете, но мой результат всегда пуст.

Веб-сайт, который я пытаюсь удалить: https://www.bodybuilding.com/exercises/dumbbell-bench-press

Соответствующий код HTML:

<div class="ExDetail" itemscope itemtype="http://schema.org/ExerciseAction">
   <section class="ExDetail-section ExDetail-meta flexo-container flexo-start flexo-between">
        <div class="grid-8 grid-12-s grid-12-m">
          <h2 class="ExHeading ExHeading--h2 ExDetail-h2" itemprop="name">
            Dumbbell Bench Press
          </h2>
        </div>

Я пытаюсь получить текст: Жим гантелей

Но я перепробовал все, что мог ..

Мой текущий код:

request(url, function(error, response, html) {

  if (!error) {
    var $ = cheerio.load(html);

    var name = $('h2.ExHeading.ExHeading--h2.ExDetail-h2').text();
    console.log(name);

    var json = {
      name: name
    };

    res.send(json);
  }

});

РЕДАКТИРОВАТЬ: Добавлена ​​ссылка, которую я пытаюсь удалить.

1 Ответ

0 голосов
/ 27 мая 2018

Ответ: Добавление в шапку поддельного пользовательского агента решило проблему!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...