Понимание вывода функции "PREDICT" в реализации Python lightGBM - PullRequest
0 голосов
/ 26 января 2019

При использовании метода Python PREDICT в lightGBM сgnatt_contrib = TRUE я получаю массив [n_samples, n_features +1].Что соответствует n_feature + 1?Сначала я подумал, что это могут быть коэффициенты логарифма класса 1, но значение не соответствует правильной вероятности.

1 Ответ

0 голосов
/ 30 января 2019

Предположим, что вы делаете регрессию от X ϵ Rn до y ϵ R1.Для заданной точки x вы можете просмотреть прогноз модели f (x) как линейную функцию от вкладов признаков, таких как: f (x) = вклад (x1) + вклад (x2) + ... + вклад (xn)) + mean (y)

Первые n столбцов вашего массива соответствуют вкладу ваших n объектов соответственно, а последний столбец - это прогноз без какой-либо информации, здесь среднее значение вашего вывода y.Если вы суммируете эти n + 1 значения, вы получите прогноз f (x).

Для классификации вы получите «необработанный прогноз».В зависимости от выбранной цели вам придется преобразовать ее в вероятность («прогноз») с помощью функции softmax или logit.

PS: надеюсь, все ясно, несмотря на плохое редактирование!

...