Эксклюзивное объединение функций в LightGBM для связанных столбцов, которые имеют ненулевые значения объектов - PullRequest
0 голосов
/ 21 апреля 2020

Давайте предположим, что два столбца объединены во время обучения с использованием эксклюзивного алгоритма объединения функций lightgbm. Связки приведены для столбцов A и B в таблице ниже.

A  B   bundle(A+B)
0  0   0
0  1   4 
0  2   5
0  1   4
1  0   1
2  0   2
3  0   3
2  1   x
1  1   y

Какое значение x и y?

Если это x = A + offset_B + B, то x = 2 + 3 + 1 = 6. Это значение (6) никогда не было видно во время тренировки. Предполагая, что мы сделали категориальное разбиение, я бы просто отнесся к этим связанным функциям как к отсутствующим. Если формула такая, как мы предполагали при вычислении значения x, y = 1 + 3 + 1 = 5. Но это так же, как если бы A было 0, а B было 2, поэтому у нас есть две комбинации, которые отображаются на одно и то же значение набора функций.

Так описанное поведение, где мы допускаем эти перекрытия, или мы отбрасываем все конфликтующие связанные функции (где A и B принимают ненулевые значения) и рассматриваем их как «отсутствующие» функции или это что-то совсем другое?

Спасибо

...