Я использую пример Variationnal AutoEncoder для данных MNIST (2D-изображения), созданных другими (http://louistiao.me/posts/implementing-variational-autoencoders-in-keras-beyond-the-quickstart-tutorial/), и изменяю его для использования его на музыке c, но у меня есть проблема.
Я выбрал этот пример, потому что автор не использует сверточные слои, только плотные слои, поэтому его легко использовать для временных рядов.
Значения изображений находятся в интервале [0,1] ([0,255] / 255).
Музыкальные значения находятся в интервале [-1,1].
Поэтому я изменил музыкальные значения, чтобы они соответствовали модели: x = (x+1)/ 2
-> [ 0,1].
Результат: сеть не учится (мой val_loss не уменьшается).
Понятия не имею почему !!!
PS: Я попытался изменить активацию relu / sigmoid на tanh вместо изменения данных. Потеря уменьшалась, но она была отрицательной ... и у меня тоже не было хороших результатов.