jQuery (Cheerio) не возвращает ссылку img src - PullRequest
0 голосов
/ 30 августа 2018

Я пытаюсь создать приложение Javascript для получения данных с HTML-страниц. Просто текст (заголовки, описания и т. Д.) Работает нормально, но по какой-то причине попытка найти URL img src не работает. Мой код ниже, а ниже приведены примеры того, что я пробовал до сих пор.

this.processDocument = function(html, url, headers, status, cheerio) {
            var app = this;
            var $ = cheerio;
            var $html = app.parseHtml(html, $);
    var object = {};

    object.title = $html.find('h1').text();
    object.title = this.removeExtraWhitespace(object.title);

    object.image = $html.find('.event_article').find('img').attr("src");

    object.copyright = $html.find('div[class="copyright"]').text();

    object.intro = $html.find('.introduction').text();
    object.intro = this.removeExtraWhitespace(object.intro);
    return JSON.stringify(object);
}

(примеры того, что я пробовал)

object.image = $html.find('.event_article').find('img').attr("src");
object.image = $html.find('.event_article img').attr("src");
object.image = $('.event_article img').attr("src");
object.image = $('.event_article img').attr("src");
object.image = $html.find('.event_article img src').text();
object.image = $(unescape($html.find('.event-article').text())).find("img").attr("src");
object.image = $('figure').find('img').attr('src')
object.image = $html.find('figure').find('img').attr('src');
object.image = $html.find($('figure img')).attr('src');

(исходный код HTML)

<div class="container">
<div class="contents_wrap">

    <!--main_contents------------------->
    <main role="main" id="main_contents">
        <div class="contents_inner">

            <!--event_article-->
            <section>
                <article class="event_article">
                    <h1 class="article_title">Bread & Coffee Party</h1>
                    <div class="info">
                        <figure class="image"><img src="https://d3cx2fdgbfj572.cloudfront.net/articles/images/000/025/392/small/a49553f4-5225-4b21-bbbb-c3c983648efb.jpg?1535574526" alt="breadandcoffee"><br><span class="copyright">John Hemberly</span></figure>

Заранее спасибо.

1 Ответ

0 голосов
/ 04 сентября 2018

Я не уверен, что проблема была в конце (также проверено на lazyload), но я взял изображение из другой части страницы. Изображение было также упомянуто в метатеге 'content' в верхней части страницы, поэтому я получил его оттуда.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...