Мне нужно спроектировать архитектуру CNN для распознавания лиц.Я нашел много примеров об этом в Интернете, которые отличаются по архитектуре CNN.Я пытаюсь узнать об особенностях, которые определяют разницу между различными архитектурами.
CNN + RNN - основная идея, поскольку выражение - это последовательность изображений лица.