Я пытаюсь обучить автоэнкодеру. Я предварительно обработал свои данные, так что непрерывные переменные масштабируются от минимального до максимального (теперь они находятся в интервале 0-1), а категориальные данные являются фиктивными переменными. В выходном слое я использую сигмоид (имеет ли это смысл?). Какую функцию потери я должен использовать для обучения? Для категориальных результатов я обычно использовал бы перекрестную энтропию, а для непрерывной, вероятно, MSE, но я хочу предсказать sth на интервале 0-1 (таким образом, сигмоид).