Я пытался построить модель машинного обучения, используя Keras, которая предсказывает дозу облучения на основе параметров предварительной обработки.В моем наборе данных приблизительно 2200 выборок, из которых 20% проходят проверку и тестирование.
Проблема с целевой переменной заключается в том, что она очень искажена, поскольку большие дозы облучения гораздо реже, чем маленькие.Следовательно, я подозреваю, что моя регрессионная модель вообще не может предсказать большие значения и предсказывает все вокруг среднего значения, что видно из рисунка.Я попытался логаризовать нормализацию целевой переменной, чтобы сделать ее более нормально распределенной, но это не имело никакого эффекта.
Любое предложение, как это исправить?
Целевая переменная
Прогнозы регрессии