Я новичок в CatBoost, и я провожу обучение CatBoostClassifier с logging_level = "Info"
.Мои данные состоят из категориальных и числовых переменных.
Во-первых, для одной из категориальных переменных в печатной информации я получаю следующее сообщение: feature 21 is redundant categorical feature, skipping it
.Как определяется избыточность этой функции?
Кроме того, я немного растерялся относительно того, что означает вся информация для итераций.Вот вывод информации для одной итерации моего обучения:
{Feature1} pr0 tb1 type0, border=10 score 2.001737609
Feature2, bin=40 score 2.867480488
{Feature3, Feature2 b40} pr2 tb2 type0, border=6 score 3.533462883
Feature4, bin=5 score 4.105045044
46: learn: -1.2759319 total: 13.2s remaining: 843ms
В этом случае Feature1 и Feature3 являются категориальными, а Feature2 и Feature4 - числовыми.
Что означают все значения, такие как pr0
, tb1
, type0
, score
и т. Д.?Любой указатель на документацию будет очень признателен.