Я собираю информацию о часах на страницах продуктов Breitling.
Рамка часов - это часть, окружающая лицо, и я хочу получить цвет рамки.
Здесь , лицо желтое, часы серебряные, а рамка черная.
Я легко могу соскрести цвет лица и часы с BeautifulSoup и Requestsиспользуя стандартные вызовы, такие как soup.find(id=...)
, но не может найти способ очистить цвет рамки. Есть ли способ сделать это?
Что я пробовал:
- Поиск по исходному коду, чтобы найти «лицевую панель» (если страница содержит это, он просто говорит вам овид рамки, но нет информации о цвете). См. этот пример и прокрутите вниз до «Технические данные»> «Корпус»> «Рамка»
- Поиск в исходном коде «черного» / других цветов. Просто возвращает результаты о других частях часов.
Одно из возможных решений (которое, я боюсь, невероятно сложное):
- Загрузите основное изображение.
- Получите цвета для 8-12 точек на рамке и выберите цвет рамки в качестве режима этих точек (хотя рамка, в основном, одного цвета, на ней также будут серебряные линии или цифры, которые кодируютсяможет подобрать отсюда размер выборки).
- Надеюсь, что координаты, которые вы используете для этих часов, будут работать для всех других часов на сайте.
Одно определенно сложное решение:
- Создать алгоритм компьютерного зрения для определения цвета лицевой панели (у меня пока нет навыков для этого)
Одно решение, не связанное с кодированием:
- Пройдите через каждые часы вручную (не пользуясь целью кодирования?)
Есть ли более простой способчтобы решить это?