Я тренируюсь sklearn KNNClassifier
в наборе цифр MNIST.
Вот код:
knn = KNeighborsClassifier()
start_time = time.time()
print (start_time)
knn.fit(X_train, y_train)
elapsed_time = time.time() - start_time
print (elapsed_time)
это займет 40 секунд. Однако, когда я тестирую на тестовых данных, это занимает более нескольких минут (все еще выполняется), тогда как тестовых данных в 6 раз меньше, чем данных о поездах.
Вот код:
y_pred = knn.predict(X_test)
print(confusion_matrix(y_test,y_pred))
Не могли бы вы объяснить, почему это занимает так много времени (больше времени, чем обучение)? Что-то, чтобы решить это?