CNN против SVM для тренировки по определению интенсивности улыбки? - PullRequest
0 голосов
/ 01 мая 2020

У меня есть набор данных, состоящий из изображений лиц, с соответствующими ориентирами, которые составляют рот. Эти ориентиры представляют собой наборы точек 2D (x, y позиция пикселя). Каждая пара данных набора изображений-ориентиров помечается либо как улыбка, либо как нейтральная.

Я хотел бы обучить модели глубокого обучения возвращению интенсивности улыбки для новой пары данных изображения-ориентира.

Что мне нужно искать, чтобы помочь мне в следующем шаге? Мне нужен CNN? В моем ограниченном понимании, обычная учебная информация - это просто изображение, на котором я буду проходить наборы ориентиров для тренировки. Или подход SVM будет более точным?

Я ищу максимальную точность, насколько это возможно.

Какой подход мне нужен?

I Я счастлив использовать PyTorch, Dlib или любой другой фреймворк, я просто немного застрял в поиске, чтобы помочь мне двигаться вперед.

Спасибо.

1 Ответ

2 голосов
/ 01 мая 2020

Трудно сказать, не изучая набор данных и не экспериментируя. Но, надеюсь, следующие материалы исследования помогут вам в правильном направлении.

Теперь, я полагаю, вы не не должно быть никакой метки для фактической интенсивности улыбки.

В таком случае существующие методы обнаружения улыбки могут использоваться напрямую, вы будете использовать последний выход активации (сигмоид) в качестве показателя достоверности для улыбки. Если достоверность выше, интенсивность должна быть выше.

Теперь вы можете использовать ориентиры для лица в качестве отдельных объектов (пропускать их через блок LSTM) и объединять их с CNN на ранней стадии / или позже. чтобы улучшить производительность вашей модели.

Если у вас есть метка для интенсивности улыбки, вы можете просто решить ее как проблему регрессии, CNN будет иметь один выход, попытается регрессировать интенсивность улыбки (нормализованная интенсивность улыбки с сигмовидной в этом случае).

...