Вы хотите взглянуть на Онлайн обучение техники для этого.Многие алгоритмы scikit-learn
имеют возможность делать partial_fit
данных, что означает, что вы можете постепенно обучаться на небольших пакетах данных.
Распространенный подход к проблемам онлайн-обучениядолжен использовать SGDClassifier
, который обучается путем взятия доли выборок для обновления параметров модели на каждой итерации, что делает ее естественным кандидатом на решение задач онлайн-обучения.Тем не менее, модель все равно должна пройти обучение по методу partial_fit
, в противном случае она будет переучивать всю модель.
Из документации :
SGD позволяетминиатюрное (онлайн / внешнее) обучение, см. метод part_fit
Вот игрушечный пример, иллюстрирующий идею:
clf = linear_model.SGDClassifier()
clf.partial_fit(x,y)
x_new = new_data
y_new = new_labels
clf.partial_fit(x_new ,y_new)