При просмотре документов LightGBM я обнаружил, что predict
поддерживает аргумент pred_leaf
. В документах написано
pred_leaf (bool, optional (default=False)) – Whether to predict
leaf index.
Однако, когда вы делаете
data := (1, 28)
gbm := num_boost_round = X
embedding = gbm.predict(data, pred_leaf=True)
embedding.shape # [1, X]
print(embedding[0, :]) # [29, 2, 8, 26, 2, 2, 16, 18, 25, 30, 16, 25, 0, 17, 15]
, я не понимаю, почему он выводит массив, который заполнен, а не горячим вектором или скалярное значение? Это говорит, что предсказывает индекс листа? Можно ли это использовать как «вложение» в другую модель?
PS: я бы отправил это в stats-stackexchange , но похоже, что это 1) спецификация c для lightgbm и 2) у них нет тега lightgbm