У меня есть набор данных, состоящий из изображений лиц, с соответствующими ориентирами, которые составляют рот. Эти ориентиры представляют собой наборы точек 2D (x, y позиция пикселя). Каждая пара данных набора изображений-ориентиров помечается либо как улыбка, либо как нейтральная.
Я хотел бы обучить модели глубокого обучения возвращению интенсивности улыбки для новой пары данных изображения-ориентира.
Что мне нужно искать, чтобы помочь мне в следующем шаге? Мне нужен CNN? В моем ограниченном понимании, обычная учебная информация - это просто изображение, на котором я буду проходить наборы ориентиров для тренировки. Или подход SVM будет более точным?
Я ищу максимальную точность, насколько это возможно.
Какой подход мне нужен?
I Я счастлив использовать PyTorch, Dlib или любой другой фреймворк, я просто немного застрял в поиске, чтобы помочь мне двигаться вперед.
Спасибо.