В приведенном ниже коде (последняя строка) используются X_test и y_test, которые в соответствии с документами:
Возвращает среднюю точность данных данных испытаний и label
Вопрос в том, что именно рассчитывается, поскольку X_test
имеет данные из тестовых данных, а y_test
имеет метки для этих данных.
Имеет смысл проверить предсказанные метки и фактические метки.
Не могли бы вы рассказать, как работает первый сценарий в последней строке?
X_train, X_test, y_train, y_test = train_test_split(iris_dataset['data'], iris_dataset['target'],
random_state=0)
knn = KNeighborsClassifier(n_neighbors=1)
knn.fit(X_train, y_train)
print("Test set score: {:.2f}".format(knn.score(X_test, y_test)))