Что означает параметр «измерение» в xgb.plot.importance - PullRequest
0 голосов
/ 02 июля 2018

Я пытался построить модель xgboost в R с помощью команды

bstSparsedel <- xgboost(data = data,  label = data[,1],max_depth = 6, eta = .3, nthread = 4, nrounds = nrow(train),verbose = 1,early_stopping_rounds = 1)

Затем пытался построить график переменной важности. В этом есть параметр measure, который имеет три типа, а именно: покрытие, усиление, частота. Что означают разные параметры? Как сюжет полностью меняется с каждой мерой.

Я пытался искать во многих местах. Если вы могли бы поделиться ссылкой, это будет полезно.

1 Ответ

0 голосов
/ 02 июля 2018

из Узнайте ваш набор данных с помощью XGBoost ...:

Усиление - это повышение точности, которое вносит функция в ветви, на которых она работает. Идея состоит в том, что перед добавлением нового разделения на элемент X в ветвь были добавлены некоторые неправильно классифицированные элементы, после добавления разделения на эту функцию появилось две новые ветви, и каждая из этих ветвей более точна (одна ветвь говорит, что если Ваше наблюдение относится к этой ветви, тогда она должна быть классифицирована как 1, а другая ветвь говорит прямо противоположное).

Покрытие измеряет относительное количество наблюдений, связанных с объектом.

Частота - это более простой способ измерения усиления. Он просто подсчитывает, сколько раз объект используется во всех сгенерированных деревьях. Вам не следует использовать его (если вы не знаете, почему хотите его использовать).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...