WEKA: Как я могу переобучить мою существующую модель новым набором наблюдений (пакетным обновлением) за раз вместо одного экземпляра за раз в Java? - PullRequest
0 голосов
/ 10 января 2019

У меня есть набор данных размером шесть миллионов, я рассматриваю пять миллионов как набор данных поезда и 1 миллион как набор тестовых данных.

Я хочу снова разделить этот обучающий набор на пять миллионов наборов данных. Изначально я хочу построить свою модель с первым миллионным набором данных, а поверх нее я хочу переобучить свою модель оставшимися четырьмя наборами данных поезда. Просто я хочу тренировать свою модель раздельно, вместо этого предоставляя весь набор данных поезда за раз. Является ли это возможным? если возможно, какие API я должен использовать и Как я могу сделать это с помощью библиотеки Weka?

Ниже приведены API, которые я хочу использовать в своем коде.

Я буду использовать buildClassifier (экземпляры экземпляров) для начальной сборки модели. поэтому я могу снова и снова вызывать buildClassifier () для оставшихся четырех наборов данных? это переучить мою модель? или каждый раз строит новую модель с новым набором данных? если возможно, как я могу код для этого?

если описанный выше случай невозможен с помощью buildClassifier (), я хочу использовать updateClassifier (экземпляр Instance), который принимает один экземпляр за раз, но я не хочу переобучать мою модель последовательным образом. Я хочу переобучиться в мини-пакетном режиме (давая набор экземпляров за раз). Как я могу сделать это с помощью weka? или есть какой-либо другой API Java, который принимает набор экземпляров для обновления классификатора в библиотеке Weka?

1 Ответ

0 голосов
/ 16 января 2019

buildClassifier создает новый классификатор, но не обновляет текущий классификатор.

...