Прогнозирование процентилей (или стандартного отклонения) с помощью DNN - PullRequest
0 голосов
/ 06 мая 2018

Мы используем DNN (с Keras и Tensorflow) для прогнозирования значения y на основе некоторых данных X, что работает довольно хорошо. Теперь мы хотели бы расширить это, чтобы не только предсказать значение y, но и его распределение в форме процентилей.

Пример: скажем, мы имеем дело с ценами на жилье. Конкретный реальный дом (с данными X’) в настоящее время продается за 1 миллион, поэтому y(X’) = 1 000 000, но мы знаем, что это высокая цена. По нашим оценкам, 90% всех сопоставимых домов (домов с одинаковыми X’) продаются дешевле, поэтому 90-й процентиль y(X’) составляет 1 миллион.

Как мы можем использовать наш набор данных (X,y) для обучения DNN, чтобы предсказать / оценить, что 90-й процентиль y(X') равен 1 миллиону?

В некотором смысле, такая сеть не только узнает, с какими значениями она может минимизировать функцию стоимости, но также и насколько велик шум при каком входе. В качестве другого примера, скажем, у нас есть определенная X', при которой цены на дома постоянны на уровне 100 000 $ (например, из-за какой-то государственной программы, которая строит тысячи совершенно одинаковых домов, которые продаются ровно за 100 000) , Я хочу, чтобы сеть не только узнала значение 100 000, но и чтобы это был очень точный прогноз.

Я думаю, что если бы мы могли предсказать стандартное отклонение, мы могли бы рассчитать разумное распределение в процентилях, поэтому, возможно, стандартного отклонения достаточно.

...