Может ли CNN распознать разницу в размере, если изображения одинаковы? - PullRequest
0 голосов
/ 21 октября 2019

Может ли CNN сказать разницу между различными размерами одного и того же организма? Как щенок против взрослого или ребенок против взрослого? Или больше похоже на большую муху против маленькой мухи, где они выглядят одинаково, но одна больше другой?

Ответы [ 2 ]

0 голосов
/ 23 октября 2019

Было бы лучше дифференцировать метрику, которую вы упоминаете в вопросе. Во-первых, это другая задача - определить возраст и размер.

Насчет возраста, да, это выполнимо. Для глубокого обучения на основе подхода вам потребуются соответствующие данные. Для подхода, не основанного на обучении (обработка изображений старой школы), вам нужно будет создать некоторые метрики для каждого объекта на основе возраста (считая морщины, белые волосы и т. Д. Для людей)

К размеру, к сожалению,, он все еще находится в стадии изучения, и неясно, будет ли он правильно выполнимым или нет. Всякий раз, когда мы упоминаем о распознавании размера объекта на одном изображении, нужно учитывать больше вещей. Первое - это перспектива. Если объект, найденный на изображении, является большим по отношению к координатам изображения, находится ли он близко к камере, хотя его размер крошечный, следовательно, он отображается как большой или он действительно огромный, но слишком далеко от камеры? Такая проблема может быть преодолена путем предварительного изучения геометрии объекта и разработки алгоритма, основанного на этой геометрии, наряду с углубленным изучением. Однако современная технология глубокого обучения недостаточно точна, чтобы различать размеры и местоположение, следовательно, геометрия объекта еще точно. Другой альтернативой будет контроль окружающей среды. Например, если вы знаете, что оба объекта лежат в одной плоскости (то есть на столе рядом друг с другом) в реальном мире, остальное - тривиальная проблема, которую нужно решить.

0 голосов
/ 22 октября 2019

На этот вопрос сложно ответить, но обычно теоретический CNN способен это сделать. Это в основном зависит от самих данных обучения. В случае, когда ребенок против взрослого, вы можете собрать набор данных, который включает в себя множество различий в размерах и возрастах, чтобы убедиться, что у вас будет модель CNN, способная находить шаблоны и обобщать в конце. В конце концов, CNN изучит многие другие функции, которые делают шкалу классификации или размер неизменными (в зависимости от размера), такие как формы, цвета, одежда и особенности лица ... и т. Д. Такие проблемы внутриклассовой классификации нелегко решить с помощью традиционного контролируемого обучения, и поэтому некоторые исследователи применяют подход, называемый « Deep Metric Learning ».

Обучение метрике - это задача изучения функции расстояния над объектами. Метрика или функция расстояния должны подчиняться четырем аксиомам: неотрицательность, тождественность неразличимых, симметрия и субаддитивность (или неравенство треугольника). На практике алгоритмы обучения метрики игнорируют условие идентичности неразличимых и учат псевдометрику. Определение Wiki

Example for Metric Learning

...