JS веб-очистка с использованием puppeteer, получая эту ошибку: (узел: 12121) UnhandledPromiseRejectionWarning: TypeError: sr c .jsonValue не является функцией - PullRequest
0 голосов
/ 11 января 2020

Привет всем , я пытаюсь что-то почистить с помощью кукловода и по какой-то причине получаю следующее сообщение об ошибке:

(node:12121) UnhandledPromiseRejectionWarning: TypeError: src.jsonValue is not a function
    at scrapeProduct (/Users/jesse/Documents/scraper/scrapers.js:12:28)
    at processTicksAndRejections (internal/process/task_queues.js:97:5)
(node:12121) UnhandledPromiseRejectionWarning: Unhandled promise rejection. This error originated either by throwing inside of an async function without a catch block, or by rejecting a promise which was not handled with .catch(). To terminate the node process on unhandled promise rejection, use the CLI flag `--unhandled-rejections=strict` (see https://nodejs.org/api/cli.html#cli_unhandled_rejections_mode). (rejection id: 1)
(node:12121) [DEP0018] DeprecationWarning: Unhandled promise rejections are deprecated. In the future, promise rejections that are not handled will terminate the Node.js process with a non-zero exit code.

Есть идеи?

I Я очень плохо знаком с узлом, который может быть моей проблемой. У меня пока нет большого кода, я только пытался сначала получить изображение для тестирования. Вот что у меня есть.

const puppeteer = require("puppeteer");

async function scrapeProduct(url) {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto(url);

  const [el] = await page.$x(
    '//*[@id="grandexchange"]/div/div[2]/main/div[2]/div[1]/img'
  );
  const src = el.getProperty("src");
  const srcTxt = await src.jsonValue();

  console.log({ srcTxt });
  await browser.close();
}

scrapeProduct(
  "http://services.runescape.com/m=itemdb_rs/Uncut+sapphire/viewitem?obj=1623"
);

Это моя вторая попытка. Я также пытался получить изображение обложки книги на Amazon.com. Получил ту же ошибку msg.

Спасибо за ваши ответы !!

1 Ответ

2 голосов
/ 11 января 2020
  1. getProperty возвращает обещание, поэтому await el.getProperty("src")
  2. всегда убедитесь, что вы ожидаете появления элемента на странице. Используйте await page.waitForXPath() для xpath и await page.waitForSelector() для селекторов.
const puppeteer = require("puppeteer");

async function scrapeProduct(url) {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto(url);

  await page.waitForXPath('//*[@id="grandexchange"]/div/div[2]/main/div[2]/div[1]/img');
  const [el] = await page.$x(
    '//*[@id="grandexchange"]/div/div[2]/main/div[2]/div[1]/img'
  );
  const src = await el.getProperty("src");
  const srcTxt = await src.jsonValue();

  console.log({ srcTxt });
  await browser.close();
}

scrapeProduct(
  "http://services.runescape.com/m=itemdb_rs/Uncut+sapphire/viewitem?obj=1623"
);

...