Давайте предположим, что два столбца объединены во время обучения с использованием эксклюзивного алгоритма объединения функций lightgbm. Связки приведены для столбцов A и B в таблице ниже.
A B bundle(A+B)
0 0 0
0 1 4
0 2 5
0 1 4
1 0 1
2 0 2
3 0 3
2 1 x
1 1 y
Какое значение x и y?
Если это x = A + offset_B + B
, то x = 2 + 3 + 1 = 6
. Это значение (6) никогда не было видно во время тренировки. Предполагая, что мы сделали категориальное разбиение, я бы просто отнесся к этим связанным функциям как к отсутствующим. Если формула такая, как мы предполагали при вычислении значения x, y = 1 + 3 + 1 = 5
. Но это так же, как если бы A было 0, а B было 2, поэтому у нас есть две комбинации, которые отображаются на одно и то же значение набора функций.
Так описанное поведение, где мы допускаем эти перекрытия, или мы отбрасываем все конфликтующие связанные функции (где A и B принимают ненулевые значения) и рассматриваем их как «отсутствующие» функции или это что-то совсем другое?
Спасибо