Проблема в том, что алгоритмы кластеризации - это алгоритмы обучения без контроля. Им не нужна зависимая переменная для прогнозирования классов. Они используются для поиска структур / сходств в точках данных. Что вы можете сделать, так это рассматривать кластерные данные как контролируемые данные.
Подход заключается в кластеризации и назначении меток в данных поезда. Обрабатывайте их как данные классификации нескольких классов, обучайте новую модель классификации нескольких классов, используя ваши данные, и проверяйте ее на тестовых данных.
Let train and test be the datasets.
clusters <- Clustering(train)
train[y] <- clusters
model <- Classification(train, train[y])
prediction <- model.predict(test)
Однако интересно, что KMeans в sklearn предоставляет метод подбора и прогнозирования. Таким образом, используя KMeans из sklearn, вы можете прогнозировать новые данные. Однако DBScan не имеет предсказания, что вполне очевидно из его рабочего механизма.