Компьютерное зрение, идеи проекта? - PullRequest
8 голосов
/ 20 июня 2010

Я студент, и это мой последний год в этой программе. Как и в любой компьютерной сфере, я должен сделать проект (индивидуальный) по любой теме, которая относится к вычислительной технике. Я хочу сделать что-то, что подпадает под компьютерное зрение (точнее, обнаружение объекта или отслеживание). При поиске информации по этой теме я обнаружил, что уже есть много людей, которые делали подобные проекты. Мой вопрос заключается в том, что если бы я занимался проектом, таким как отслеживание объекта в видео, должен ли я придумать свой собственный алгоритм или уже есть какие-либо алгоритмы? (Я знаком с Java и немного начал Python)

Пожалуйста, помогите мне выбрать тему и некоторые идеи о том, как начать или с чего начать.

Ответы [ 5 ]

6 голосов
/ 20 июня 2010

Я прошел базовый курс по компьютерному зрению во время обучения в аспирантуре, и одним из первых наших проектов было внедрение системы, которая объединяет серии изображений в бесшовную 360-градусную панораму.

Включено:

  1. обнаружение отличительных признаков на отдельных изображениях (с использованием извлечения функции SIFT),
  2. лучшие функции сопоставления на других изображениях (сопоставление функций),
  3. автоматическое выравнивание картинок (оценка гомографии),
  4. определение их перекрытия и относительного положения камер (оценка позы камеры),
  5. проецирование изображений в цилиндрическую систему координат (деформация изображения),
  6. и, наконец, объединение полученных фотографий в единую бесшовную панораму (смешивание изображений).

Задача этого проекта - сделать код достаточно эффективным, чтобы обеспечить быстрое сшивание изображений.

Вы можете найти много ресурсов в Интернете, чтобы помочь вам с проектом.

3 голосов
/ 20 июня 2010

Если вы хотите сделать что-то действительно крутое и интересное, попробуйте разработать алгоритм обнаружения активности в видео.Например, «человек, выходящий из машины», «люди, входящие в здание» и т. Д. Это не тривиальная задача и достаточно сложная для дипломной работы.Вы могли бы использовать инструментарий, такой как OpenCV, чтобы начать работу по обработке видео, обнаружению объектов и т. Д., В то же время сосредоточившись на алгоритме.

1 голос
/ 20 июня 2010

Существует множество алгоритмов компьютерного зрения и анализа изображений.Несколько лет назад я проходил урок по этому предмету в аспирантуре, и это было интересно, поэтому я предлагаю посмотреть в вашей университетской библиотеке или книжном магазине текст на эту тему, чтобы лучше понять, что доступно.Реальные приложения для этой технологии.Оптическое распознавание символов (OCR) - это одна из областей, в которой появилось какое-то громкое приложение.

Вы выбрали интересную тему, веселитесь!:)

0 голосов
/ 12 апреля 2017

Ниже приведены некоторые идеи проекта в области компьютерного зрения, которые могут вас заинтересовать:

  1. Изучение множества цифр MNIST
  2. Визуальные слова для поиска изображений
  3. Сегментация изображения с использованием непараметрической кластеризации
  4. Классификация видео с использованием CNN
  5. Поиск изображений на основе CNN и встраивание PCA
  6. Отслеживание фильтра Калмана
  7. Сжатие видео на основеsuperpixels
  8. Оптическое распознавание символов с использованием нейронных сетей
  9. Визуальное и семантическое встраивание (создание подписей для изображений)

Для начала работы с проектами глубокого обучения я рекомендую Kerasбиблиотека, которая работает на Theano / TensorFlow в качестве бэкэнда с многочисленными примерами .Кроме того, вы найдете полезные руководства по OpenCV .Кроме того, вы можете найти реализации некоторых из перечисленных выше проектов на следующей странице github .

0 голосов
/ 04 июля 2010

Начальная точка с python и openCV:

http://creatingwithcode.com/howto/face-detection-in-static-images-with-python

...