В сложенных автоэнкодерах во время послойного обучения отдельных автоэнкодеров с использованием градиентного спуска и обратного распространения, чтобы минимизировать ошибку восстановления, среднеквадратическую ошибку.Каковы идеальные критерии остановки для предварительной подготовки?Как я могу настроить гиперпараметры для модели перед тренировкой без присмотра?Я могу использовать перекрестную проверку в этой ситуации?