почему кажется лучше, когда GBDT использует квадратные потери, чем перекрестные энтропийные потери в задаче классификации 0-1 - PullRequest
0 голосов
/ 20 февраля 2019

Что касается задачи классификации 0-1, GBDT должен использовать перекрестную потерю энтропии (то есть: градиент = (1 - y) / (1 - y_pred) - (y / y_pred)), но для сравнения я также использую квадратпотеря (то есть: градиент = y_pred-y);и, наконец, я считаю, что они почти одинаковы, если не квадратная потеря лучше.в чем дело?

перекрестная потеря энтропии

квадратная потеря

...