Что такое хорошая библиотека компьютерного зрения для Python, которая позволяет мне находить лица в видео Flash / HTML5? - PullRequest
2 голосов
/ 09 ноября 2010

Мне нужно разработать скрипт с использованием компьютерного зрения, который будет:

  1. Сканирование всех кадров видео Flash / HTML5 на лица людей
  2. Определите кадры видео, на которых показаны лица, смотрящие прямо в камеру
  3. Обрезать лицо в идеальный квадрат
  4. Скопируйте обрезанное лицо в файл .PNG

Какие-нибудь рекомендации для библиотеки компьютерного зрения Python, которые могли бы помочь мне разработать этот сценарий?

Ответы [ 2 ]

4 голосов
/ 09 ноября 2010

OpenCV, вероятно, лучший вариант для вашего конкретного случая использования: http://opencv.willowgarage.com/wiki/

Он имеет некоторую встроенную поддержку для стандартных алгоритмов распознавания лиц, и в Python его довольно легко запустить и запустить. Однако, хотя это довольно глубокая библиотека, я уверен, что вам придется найти что-то еще, чтобы сначала получить изображения из Flash и передать их в свою утилиту. Я не уверен насчет обрезки, но для такого рода вещей я уверен, что библиотека изображений Python будет работать, если OpenCV не сделает этого.

Надеюсь, это поможет.

1 голос
/ 09 ноября 2010

Как сказал jonesy opencv - ваш лучший выбор для определения лица "из коробки".

Чтобы использовать флэш-видео в качестве стимула, вам нужно что-то, что позволит вам читать.FLV (Flash Video) файлы, которые вы можете подключить к OpenCV.Я сам не пробовал, но я думаю, что если вы установите opencv с поддержкой ffmpeg (если вы используете Linux), вы сможете читать большинство видео с opencv, включая .flv (или любой html5видео формат).

Для обрезки это объясняет, что вы хотите.Для сохранения обрезанного изображения в формате png обратитесь к документации imwrite .

...