Очистка информации с изображения с помощью запросов и BeautifulSoup - PullRequest
0 голосов
/ 09 октября 2019

Я собираю информацию о часах на страницах продуктов Breitling.

Рамка часов - это часть, окружающая лицо, и я хочу получить цвет рамки.

Здесь , лицо желтое, часы серебряные, а рамка черная.

Я легко могу соскрести цвет лица и часы с BeautifulSoup и Requestsиспользуя стандартные вызовы, такие как soup.find(id=...), но не может найти способ очистить цвет рамки. Есть ли способ сделать это?

Что я пробовал:

  • Поиск по исходному коду, чтобы найти «лицевую панель» (если страница содержит это, он просто говорит вам овид рамки, но нет информации о цвете). См. этот пример и прокрутите вниз до «Технические данные»> «Корпус»> «Рамка»
  • Поиск в исходном коде «черного» / других цветов. Просто возвращает результаты о других частях часов.

Одно из возможных решений (которое, я боюсь, невероятно сложное):

  • Загрузите основное изображение.
  • Получите цвета для 8-12 точек на рамке и выберите цвет рамки в качестве режима этих точек (хотя рамка, в основном, одного цвета, на ней также будут серебряные линии или цифры, которые кодируютсяможет подобрать отсюда размер выборки).
  • Надеюсь, что координаты, которые вы используете для этих часов, будут работать для всех других часов на сайте.

Одно определенно сложное решение:

  • Создать алгоритм компьютерного зрения для определения цвета лицевой панели (у меня пока нет навыков для этого)

Одно решение, не связанное с кодированием:

  • Пройдите через каждые часы вручную (не пользуясь целью кодирования?)

Есть ли более простой способчтобы решить это?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...