Я пытаюсь выучить модель (один скрытый слой), которая может соответствовать кривой x ** (3.4) + x ** (0.7)
Но это не подходит, даже если я использую скрытую ширину 1000слой
Вот тетрадь https://colab.research.google.com/drive/1Vap3SExRmsA3GBK6Kg2eoSlhgt-5v7qP
Может кто-нибудь объяснить, что не так с кодом?
Вы задаете входы вашей модели в диапазоне 0-2, в то время как сеть может генерировать только 0-1 выходы. Попробуйте сначала нормализовать ваши входные данные. Одним простым способом является деление на максимум всех входов обучения. Я уверен, что torch предлагает и другие способы нормализации ввода.
https://colab.research.google.com/drive/1LAosaHTE76ekZ3FSyJwjOyHPXDVL35vk