У меня есть набор данных размером шесть миллионов, я рассматриваю пять миллионов как набор данных поезда и 1 миллион как набор тестовых данных.
Я хочу снова разделить этот обучающий набор на пять миллионов наборов данных.
Изначально я хочу построить свою модель с первым миллионным набором данных, а поверх нее я хочу переобучить свою модель оставшимися четырьмя наборами данных поезда. Просто я хочу тренировать свою модель раздельно, вместо этого предоставляя весь набор данных поезда за раз. Является ли это возможным? если возможно, какие API я должен использовать и
Как я могу сделать это с помощью библиотеки Weka?
Ниже приведены API, которые я хочу использовать в своем коде.
Я буду использовать buildClassifier (экземпляры экземпляров) для начальной сборки модели.
поэтому я могу снова и снова вызывать buildClassifier () для оставшихся четырех наборов данных? это переучить мою модель? или каждый раз строит новую модель с новым набором данных? если возможно, как я могу код для этого?
если описанный выше случай невозможен с помощью buildClassifier (), я хочу использовать updateClassifier (экземпляр Instance), который принимает один экземпляр за раз, но я не хочу переобучать мою модель последовательным образом. Я хочу переобучиться в мини-пакетном режиме (давая набор экземпляров за раз). Как я могу сделать это с помощью weka? или есть какой-либо другой API Java, который принимает набор экземпляров для обновления классификатора в библиотеке Weka?