Очистить данные с веб-сайта, который занимает первое место в поисковой сети EAN / UPC Google - PullRequest
0 голосов
/ 27 февраля 2019

Мне любопытно, будет ли возможна следующая автоматизация:

  1. поиск в Google для поиска кода UCP / EAN номера (например, 8710103703631)
  2. очистить и проанализировать данные (в зависимости от того, что доступно) с первой страницы рейтинга относительно Продукт :
    • Имя
    • Марка
    • Модель
    • Изображение
    • Описание

Просто пытаюсь понять, насколько это может быть сложно.

Спасибо!

1 Ответ

0 голосов
/ 27 февраля 2019

Поиск EAN / UPC-кодов через API

Существует несколько бесплатных веб-API , которые (обратный) ищут штрих-коды (EAN / UPC) или предоставляют дополнительную информацию.

Например, ean-search.org - это REST API, который запрашивается EAN и доставляет XML (например, предоставляет ссылку на Amazon для вашего образца «Philips Sonicare»).

Преимущество использования API: готовые к использованию данные , не требуется очистка.

веб-очистка для результатов поиска

Конечно, вы можете использовать поисковые системы (такие как Google, duckduckgo и т. д.) и найдите штрих-код , используя любимую web-scraping библиотеку на желаемом языке программирования:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...