почему кажется лучше, когда GBDT использует квадратные потери, чем перекрестные энтропийные потери в задаче классификации 0-1

Что касается задачи классификации 0-1, GBDT должен использовать перекрестную потерю энтропии (то есть: градиент = (1 - y) / (1 - y_pred) - (y / y_pred)), но для сравнения я также использую квадратпотеря (то есть: градиент = y_pred-y);и, наконец, я считаю, что они почти одинаковы, если не квадратная потеря лучше.в чем дело?

перекрестная потеря энтропии

квадратная потеря

почему кажется лучше, когда GBDT использует квадратные потери, чем перекрестные энтропийные потери в задаче классификации 0-1

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

почему кажется лучше, когда GBDT использует квадратные потери, чем перекрестные энтропийные потери в задаче классификации 0-1

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы