Я использую Random Forest в Weka 3.9 GUI. Мой набор данных содержит 211965 экземпляров с 95 атрибутами. Я классифицирую числовое значение.
Когда я сохраняю модель, ее размер составляет 1 951 834 КБ, и она слишком велика, чтобы загрузить ее в мое приложение Java с помощью Weka API.
Я делаю что-то не так, что файл настолько большой?
Вот вывод классификатора от Weka, поэтому вы можете увидеть параметры, которые я использовал (я удалил список атрибутов из него, чтобы сделать его короче).
=== Информация о запуске ===
Схема weka.classifiers.trees.RandomForest -P 100 -I 30-num-slots 0 -K 0 -M 1.0 -V 0.001 -S 1 -depth 21
Отношение all_cars_wo_cena300k3
Экземпляры 211965
Атрибуты 95
Тестовый режим оценки по тренировочным данным
=== Модель классификатора (полный обучающий набор) ===
RandomForest
Пакетирование с 30 итерациями и базовым учеником
weka.classifiers.trees.RandomTree -K 0 -M 1,0 -V 0,001 -S 1-глубина 21 -не-не-проверять-возможности
Время, необходимое для построения модели 15,02 секунды
=== Оценка на тренировочном наборе ===
Время, затраченное на тестирование модели на тренировочных данных 6,36 секунды
=== Резюме ===
Коэффициент корреляции 0,9978
Средняя абсолютная ошибка 1532,7018
Среднеквадратическая ошибка 3087.1285
Относительная абсолютная погрешность 5,1246%
Корневая относительная квадратичная ошибка 6,9288%
Общее количество экземпляров 211965