Обещания с cheerio и ax ios - вложены по l oop внутрь - PullRequest
0 голосов
/ 25 мая 2020

Я отказываюсь от веб-сайта, похожего на craiglist.

Моя основная цель - построить и создать такие объекты (пример для автомобильной рекламы): этот король объектов, с каждой рекламой, которую я получаю с этого веб-сайта.

Моя проблема в том, что я могу достичь этого массива объектов, но я могу обработать его для сохранения изображений на диске после того, как я создал.

Я думаю, что что-то не так с обещаниями:

const fs = require('fs')
const axios = require('axios');
const $ = require('cheerio', { decodeEntities: true });

const url = 'https://www.website.com/anuncios/700000000.htm';

const adArray = [];

const axiosData = axios.get(url,{responseType: 'arraybuffer',responseEncoding: 'binary'})
    .then(result => {
        const myP = $('.aditem', result.data.toString('binary')).each((i, element) => {
            function checkCVinTitle (cv, model) {
                const cvNoSpace = cv.replace(' ', '');
                if(model){
                    if(model.includes(cv.toUpperCase())) {
                        createAdObject.model = model.replace(cv.toUpperCase(),''); 
                    } 
                    else if(model.includes(cvNoSpace.toUpperCase())){
                        createAdObject.model = model.replace(cvNoSpace.toUpperCase(),''); 
                    }
                    else {
                        // console.log('no model')
                    }
                    return createAdObject.model;
                }
            }
            const capitalize = (str, lower = false) =>
            (lower ? str.toLowerCase() : str).replace(/(?:^|\s|["'([{])+\S/g, match => match.toUpperCase());

                const createAdObject = {};
                // cheerio variables for each parametter
                const titleAndModel = $('.aditem-detail-title', element).text();
                const brandAndPlace = $('.display-desktop.list-location-link', element).text();
                const cv = $('.cc.tag-mobile', element).text();
                const location = $('.list-location-region', element).text();
                const transmision = $('.cmanual.tag-mobile', element).text();
                const fuel = $('.gas.tag-mobile', element).text();
                const km = $('.kms.tag-mobile', element).text();
                const year = $('.ano.tag-mobile', element).text();
                const doors = $('.ejes.tag-mobile', element).text();
                const description = $('.tx', element).text();
                const price = $('.aditem-price', element).text();
                const vendor = $('.pillDiv.pillSellerTypePro', element).text();
                const reference = $('.x5', element).text();
                const type = $('.x3', element).text();

                    createAdObject.title = titleAndModel.split(' - ')[0];
                    createAdObject.cv = cv;
                    createAdObject.model = titleAndModel.split(' - ')[1];
                    checkCVinTitle(cv, createAdObject.model);
                    createAdObject.brand = brandAndPlace.split(' de segunda mano en ')[0];
                    createAdObject.place = brandAndPlace.split(' de segunda mano en ')[1];
                    createAdObject.location = capitalize(location);
                    createAdObject.transmision = transmision;
                    createAdObject.fuel = fuel;
                    createAdObject.km = km;
                    createAdObject.year = year.split(' ')[1]
                    createAdObject.doors = doors;
                    createAdObject.description = description.replace('\n', ' ');
                    createAdObject.vendor = vendor;
                    createAdObject.reference = reference.replace(/\s/g,'');
                    createAdObject.price = price.replace('€', '');
                    createAdObject.type = type;
                    createAdObject.image = [];
                    // function generate array images
                        let promises = [];
                        const averageImage = 5;
                        for(let i=1; i < averageImage; i++){
                            const image = `https://img.website.com/fg/${createAdObject.reference.slice(1,5)}/${createAdObject.reference.slice(5,7)}/${createAdObject.reference.substr(1)}_${i}.jpg`;
                            promises.push(axios.get(image)
                                .then(response => {
                                    // response.status == 200 ? createAdObject.image.push(image) : console.log('something wrong with images')
                                    response.status == 200 ? createAdObject.image.push(image) : ''
                                    })
                                .catch(error => console.log())
                            )
                        }
                        return Promise.all(promises)
                        .then(() => {
                            type == 'OFERTA' ? createAdObject.brand != 'Scooters' ? adArray.push(createAdObject)  : '' : '';
                            console.log('hey3')
                        })
                        .catch(error => console.log(error))
        })
        return Promise.all([myP])
        .then(() => console.log('hey2'))
    })
    return Promise.all([axiosData])
    .then(() => console.log('hey'))
    .catch(error => console.log(error))

Я пробовал сделать это без переменной:

$('.aditem', result.data.toString('binary')).each((i, element) => {

Когда я запускаю скрипт, он выводит это:

hey2
hey



hey3
hey3
hey3
hey3
hey3
hey3
hey3

Я тоже изменил возвраты, но, похоже, у меня ничего не работает.

Почему я не ждал этого обещания. all?

return Promise.all ( [axiosData])

Есть что-то в cheerio, которое не может заставить foreach ждать обещаний?

Предлагается ОБНОВЛЕНИЕ:

const fs = require('fs')
const axios = require('axios');
const $ = require('cheerio', { decodeEntities: true });

const url = 'https://www.website.com/ads/700000000.htm';

const adArray = [];

const axiosData = axios.get(url,{responseType: 'arraybuffer',responseEncoding: 'binary'})
    .then(result => {
        const theMap = $('.aditem', result.data.toString('binary')).map(element => {
            function checkCVinTitle (cv, model) {
                const cvNoSpace = cv.replace(' ', '');
                if(model){
                    if(model.includes(cv.toUpperCase())) {
                        createAdObject.model = model.replace(cv.toUpperCase(),''); 
                    } 
                    else if(model.includes(cvNoSpace.toUpperCase())){
                        createAdObject.model = model.replace(cvNoSpace.toUpperCase(),''); 
                    }
                    else {
                        // console.log('no model')
                    }
                    return createAdObject.model;
                }
            }
            const capitalize = (str, lower = false) =>
            (lower ? str.toLowerCase() : str).replace(/(?:^|\s|["'([{])+\S/g, match => match.toUpperCase());

                const createAdObject = {};
                // cheerio variables for each parametter
                const titleAndModel = $('.aditem-detail-title', element).text();
                const brandAndPlace = $('.display-desktop.list-location-link', element).text();
                const cv = $('.cc.tag-mobile', element).text();
                const location = $('.list-location-region', element).text();
                const transmision = $('.cmanual.tag-mobile', element).text();
                const fuel = $('.gas.tag-mobile', element).text();
                const km = $('.kms.tag-mobile', element).text();
                const year = $('.ano.tag-mobile', element).text();
                const doors = $('.ejes.tag-mobile', element).text();
                const description = $('.tx', element).text();
                const price = $('.aditem-price', element).text();
                const vendor = $('.pillDiv.pillSellerTypePro', element).text();
                const reference = $('.x5', element).text();
                const type = $('.x3', element).text();
                // const image = $('img', element)[0].attribs.src
                // const numberImages = $('.mini-overlay-superior', element).text();

                    createAdObject.title = titleAndModel.split(' - ')[0];
                    createAdObject.cv = cv;
                    createAdObject.model = titleAndModel.split(' - ')[1];
                    checkCVinTitle(cv, createAdObject.model);
                    createAdObject.brand = brandAndPlace.split(' de segunda mano en ')[0];
                    createAdObject.place = brandAndPlace.split(' de segunda mano en ')[1];
                    createAdObject.location = capitalize(location);
                    createAdObject.transmision = transmision;
                    createAdObject.fuel = fuel;
                    createAdObject.km = km;
                    createAdObject.year = year.split(' ')[1]
                    createAdObject.doors = doors;
                    createAdObject.description = description.replace('\n', ' ');
                    createAdObject.vendor = vendor;
                    createAdObject.reference = reference.replace(/\s/g,'');
                    createAdObject.price = price.replace('€', '');
                    createAdObject.type = type;
                    createAdObject.image = [];
                    // function generate array images
                        let promises = []
                        const averageImage = 5;
                        for(let i=1; i < averageImage; i++){
                            const image = `https://img.milanuncios.com/fg/${createAdObject.reference.slice(1,5)}/${createAdObject.reference.slice(5,7)}/${createAdObject.reference.substr(1)}_${i}.jpg`;
                                promises.push(axios.get(image)
                                    .then(response => {
                                        response.status == 200 ? createAdObject.image.push(image) : ''
                                    })
                                    .catch(error => console.log())
                                )
                        }
                        return Promise.all(promises)
                        .then(() => {
                            type == 'OFERTA' ? createAdObject.brand != 'Scooters' ? adArray.push(createAdObject)  : '' : '';
                        })
        })
        Promise.all([theMap])
        .then(console.log(adArray))
    })
    Promise.all([axiosData])
    .then(() => console.log(adArray))
    .catch(error => console.log(error))

Ответы [ 3 ]

1 голос
/ 26 мая 2020

Примерно так:

(async()=>{
    if(type != 'OFERTA') return;
    const result = await axios.get(url,{responseType: 'arraybuffer',responseEncoding: 'binary'})
    // $.map instead $.each as map rtn [] and each rtns undefined
    const adArray = await $('.aditem', result.data.toString('binary')).map( async (index, element) => {
        const createAdObject = adObject(element);
        if(createAdObject.brand == 'Scooters') return;
        const averageImage = 5;
        const promises = Array.from({length: averageImage}, async (_, i) => {
            let image = imageStr(i, createAdObject)
            return axios.get(image)
        })
        const images = await Promise.all(promises)
        createAdObject.image.push(...images)
        return createAdObject
    })
})
1 голос
/ 26 мая 2020

Вы должны использовать $(selector).map() вместо $(selector).each().

each() возвращает undefined, а Promise.all пропускает все значения, не являющиеся обещаниями (или, точнее, значения, не подлежащие затемнению), как показано ниже.

Promise.all([4, "hello", undefined])
.then(() => {
    console.log("done");
});
0 голосов
/ 27 мая 2020

Я решил с нужной структурой. (Спасибо всем за комментарии и время на ответ. map было очень важно для понимания!).

Это мой код:

const fs = require('fs');
const axios = require('axios');
const $ = require('cheerio', { decodeEntities: true });

const url = 'https://www.website.com/ads/123telephonenumber.htm';

const adArray = [];

const axiosData = axios.get(url,{responseType: 'arraybuffer',responseEncoding: 'binary'})
    .then(result => {
        $('.aditem', result.data.toString('binary')).map((i,element) => {
            function checkCVinTitle (cv, model) {
                const cvNoSpace = cv.replace(' ', '');
                if(model){
                    if(model.includes(cv.toUpperCase())) {
                        createAdObject.model = model.replace(cv.toUpperCase(),''); 
                    } 
                    else if(model.includes(cvNoSpace.toUpperCase())){
                        createAdObject.model = model.replace(cvNoSpace.toUpperCase(),''); 
                    }
                    else {
                        // console.log('no model')
                    }
                    return createAdObject.model;
                }
            }
            const capitalize = (str, lower = false) =>
            (lower ? str.toLowerCase() : str).replace(/(?:^|\s|["'([{])+\S/g, match => match.toUpperCase());

                const createAdObject = {};
                // cheerio variables for each parametter
                const titleAndModel = $('.aditem-detail-title', element).text();
                const brandAndPlace = $('.display-desktop.list-location-link', element).text();
                const cv = $('.cc.tag-mobile', element).text();
                const location = $('.list-location-region', element).text();
                const transmision = $('.cmanual.tag-mobile', element).text();
                const fuel = $('.gas.tag-mobile', element).text();
                const km = $('.kms.tag-mobile', element).text();
                const year = $('.ano.tag-mobile', element).text();
                const doors = $('.ejes.tag-mobile', element).text();
                const description = $('.tx', element).text();
                const price = $('.aditem-price', element).text();
                const vendor = $('.pillDiv.pillSellerTypePro', element).text();
                const reference = $('.x5', element).text();
                const type = $('.x3', element).text();
                // const image = $('img', element)[0].attribs.src
                // const numberImages = $('.mini-overlay-superior', element).text();

                    createAdObject.title = titleAndModel.split(' - ')[0];
                    createAdObject.cv = cv;
                    createAdObject.model = titleAndModel.split(' - ')[1];
                    checkCVinTitle(cv, createAdObject.model);
                    createAdObject.brand = brandAndPlace.split(' de segunda mano en ')[0];
                    createAdObject.place = brandAndPlace.split(' de segunda mano en ')[1];
                    createAdObject.location = capitalize(location);
                    createAdObject.transmision = transmision;
                    createAdObject.fuel = fuel;
                    createAdObject.km = km;
                    createAdObject.year = year.split(' ')[1]
                    createAdObject.doors = doors;
                    createAdObject.description = description.replace('\n', ' ');
                    createAdObject.vendor = vendor;
                    createAdObject.reference = reference.replace(/\s/g,'');
                    createAdObject.price = price.replace('€', '');
                    createAdObject.type = type;
                    createAdObject.image = [];
                    type == 'OFERTA' ? createAdObject.brand != 'Scooters' ? adArray.push(createAdObject)  : '' : '';
        })
    })
    Promise.all([axiosData])
    .then(() => {
        let promises = [];
        const averageImage = 10;
        const fullAdArray = adArray.map( element => {
            for(let i=1; i < averageImage; i++){
                const image = `https://img.website.com/fg/${element.reference.slice(1,5)}/${element.reference.slice(5,7)}/${element.reference.substr(1)}_${i}.jpg`;
                    promises.push(axios.get(image)
                        .then(response => {
                            response.status == 200 ? element.image.push(image) : ''
                        })
                        .catch(error => console.log(error))
                    )
            }
            return Promise.all(promises)
            .then(() => element)
        })
        return Promise.all(fullAdArray);
    })
    .then(result => console.log(result))
    .catch(error => console.log(error))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...