Подмножество функций на внешней памяти - PullRequest
0 голосов
/ 06 мая 2019

У меня есть большой файл, который я не могу загрузить, поэтому я использую локальный файл с xgb.DMatrix. Но я хотел бы использовать только подмножество функций. В документации на xgboost сказано, что аргумент colset на slice "в настоящее время не используется", и на странице github нет упоминаний об этой функции. И я не нашел других подсказок о том, как выполнять поднабор столбцов с помощью внешней памяти.

Я хочу сравнить модели, созданные с поднаборами различных функций. Единственное, о чем я могу подумать, - это создать новый файл с теми функциями, которые я хочу использовать, но это займет много времени и займет много памяти ... Не могу не задуматься, есть ли лучший способ.

пс .: Я тоже пытался использовать пакет h2o, но h2o.importFile застыл.

...