Распознавание изображений + модель ориентации для распознавания начальной и конечной точек объекта - PullRequest
0 голосов
/ 02 ноября 2018

Я ищу реализацию модели распознавания изображений, которая способна определять начальную и конечную точки линейных объектов (бейсбольная бита, теннисная ракетка, вилка / ложка). Начальная и конечная точки относятся к:

  1. Бейсбольная бита - Начальная точка - это начальная базовая точка летучей мыши, в которой находится ручка и удерживающая ее. Конечная точка - верхушка летучей мыши.
  2. Теннисная ракетка - Начальная точка - это основа, где расположена рукоятка, и удерживайте ракетку. Конечная точка - вершина теннисной ракетки.
  3. Вилка / ложка - Начальная точка - это место, где кто-то держит вилку / ложку, а конечной точкой являются 4 зубца вилки (среднее расстояние между 4)

По сути, начальная точка представляет конец местоположения объекта (x1, y1), где кто-то удерживает / захватывает объект. Другой конец - это место (x2, y2) на противоположном конце объекта.

Цель - цель состоит в том, чтобы распознать объект вместе с начальной и конечной точками. Мне интересно, возможно ли упростить текущие CNN распознавания объектов, такие как YOLO, поэтому вместо ограничительной рамки я передаю только x1, y1 начальную точку и x2, y2 конечную точку, чтобы можно было нарисовать линию, отслеживающую положение / ориентацию объекта , Или создайте новую нейронную сеть для распознавания объектов плюс 2 новых функции (начальная и конечная точка)

...