Как я могу удалить страницу, у которой нет определенного имени, и использовать произвольное имя класса для элементов.
Я в основном копирую HTML и просто публикую на нем немного контента, чтобы я мог сделать он работает, используя JavaScript, который в настоящее время отображает вывод в консоли, но когда я помещаю его в кукловод, он всегда выдает мне ошибку.
Если вы посещаете страницу http://sx8army.com/test.html и проверяете элемент, вы можете увидеть название продукта и цену продукта, который я планирую получить слишком надеемся, включая стоимость значения для продукта.
Заранее спасибо.
const puppeteer = require('puppeteer');
(async () => {
const browser = await puppeteer.launch()
const page = await browser.newPage()
let url = 'http://www.sx8army.com/test.html';
await page.goto(url, {waitUntil: 'load', timeout: 10000});
await page.setViewport({ width: 2195, height: 1093 });
await page.screenshot({ fullPage: true, path: 'carousell.png' });
const products = await page.evaluate(
document.querySelectorAll('main').forEach(main => {
main.querySelectorAll('a').forEach(product => {
const product_details = product.querySelectorAll('p');
const productName = product.textContent;
const productHref = product.getAttribute('href');
//console.log(product_details[0].textContent + " - "+ product_details[1].textContent);
//console.log("["+productName + "] " + productHref);
});
})
);
await browser.close()
})()