У меня есть большой файл, который я не могу загрузить, поэтому я использую локальный файл с xgb.DMatrix
. Но я хотел бы использовать только подмножество функций. В документации на xgboost
сказано, что аргумент colset
на slice
"в настоящее время не используется", и на странице github нет упоминаний об этой функции. И я не нашел других подсказок о том, как выполнять поднабор столбцов с помощью внешней памяти.
Я хочу сравнить модели, созданные с поднаборами различных функций. Единственное, о чем я могу подумать, - это создать новый файл с теми функциями, которые я хочу использовать, но это займет много времени и займет много памяти ... Не могу не задуматься, есть ли лучший способ.
пс .: Я тоже пытался использовать пакет h2o
, но h2o.importFile
застыл.