Я знаю, что у меня очень маленький набор данных, но я пытался запустить модель Lightgbm, чтобы посмотреть, смогу ли я получить что-то из этого. И хотя выборка очень мала, я думаю, что в данных есть некоторые закономерности, которые могут, по крайней мере, привести к ошибочной, но понятной классификации. Я запустил матрицу корреляции, и два столбца имеют небольшую корреляцию с целью (последний столбец)
Я использовал Logisti c Регрессия для той же цели, и результаты были немного лучше (по крайней мере, не полностью случайными)
Я хотел бы знать, правильно ли я использую Lightgbm или это нормально, учитывая размер набора данных.
Моя модель Lightgbm:
parameters = {
'objective': 'multiclass',
'num_class':4,
'metric': 'multi_logloss',
#'is_unbalance': 'true',
'boosting': 'gbdt',
'num_leaves': 200,
'feature_fraction': 0.9,
'bagging_fraction': 0.8,
'bagging_freq': 5,
'learning_rate': 0.001,
'verbose': 1
}
С уважением