Обнаружение объектов с использованием среды - PullRequest
0 голосов
/ 19 декабря 2018

Я хотел бы задать общий вопрос об алгоритмах обнаружения объектов на основе DNN, таких как Yolo, SSD или R-CNN.

Предположим, я хотел бы обнаруживать мобильные телефоны на небольших изображениях, где - следовательно,- сами мобильные устройства очень малы, более того, их практически невозможно обнаружить только по тем пикселям, на которых они появляются.Например, глядя на изображение размером 300x300, мобильный телефон отображается в виде сетки 7x5, поэтому, только глядя на изображение 7x5, никто не может точно решить, что там можно увидеть.

С другой стороны, если мыПосмотрите на вагон метро на картинке, где у человека в руке есть что-то черное, мы (люди) почти уверены, что маленькая черная сетка 7x5 означает мобильное устройство.

man_with_phone

Правильно ли я понимаю, что современные современные алгоритмы DNN не могут захватывать окружающую среду, как это делают люди, а обнаруживают объекты только по их физическому появлению на изображении?Если нет, то можете ли вы предложить алгоритм, который не обязательно обучается только на группе черных пикселей, но способен захватить человека, который держит в руке черную вещь, которая, вероятно, будет телефоном?

Спасибо.

Ответы [ 2 ]

0 голосов
/ 19 декабря 2018

Это может быть слабо связано с алгоритмами отслеживания.Как правило, вы будете использовать LSTM или другой алгоритм в сочетании с CNN для прогнозирования поведения человека на изображениях временных рядов.

Я не понимаю, почему вы не смогли настроить свой набор данных с целевыми метками телефонов, а не с телефонами, которыми CNN могла бы предсказать метку класса.R-CNN или Yolo не выйдут из коробки, как это, поэтому вам нужно будет индивидуально подобрать свой алгоритм и тренировочный набор для этого приложения.

Понимание человеческого поведения является важной и активной темой исследования для глубокого обучения прямо сейчас.Предсказание поведения для такой задачи, вероятно, не так широко распространено в общих библиотеках, поскольку они могут быть более специфичными для предметной области задач, и исследование является новым, но это не означает, что это невозможно.

Это обзорная статья по этой теме, которая может относиться к вашему вопросу: https://arxiv.org/pdf/1806.11230.pdf. Вы также можете захотеть изучить исследование, проводимое с отслеживанием объектов, поскольку оно аналогично (но охватываетболее широкий охват, чем просто обнаружение того, что кто-то держит).

0 голосов
/ 19 декабря 2018

Мой фон не обнаружение объекта.В исследовании существует такая контекстная информация.Это трубопровод, который еще не решен.Есть несколько примеров, примененных к сегментации экземпляров и текстовым заголовкам.

Поэтому я предполагаю, что есть исследования в области обнаружения объектов, дающие контекстную информацию.

В любом случае, SSD использует схему пирамиды, в которой закодирована контекстная информация

...