K Ближайший сосед Python - PullRequest
0 голосов
/ 18 марта 2019

Я новичок в области интеллектуального анализа данных. Я пытался внедрить классификатор KNN в отдельных наборах данных для обучения и тестирования.все учебники, которые я вижу, используют метод train_test_split для разделения набора данных, тогда как у меня уже есть набор данных, разбитый на Train и Test.Как мне назначить целевую переменную?

1 Ответ

1 голос
/ 18 марта 2019

Я предполагаю, что ваши test данные помечены (т. Е. Логически разделены на test_X и test_y, и вы использовали бы это для проверки производительности вашей модели, которую вы обучили на train данных.

  1. Загрузка данных поезда в (train_X, train_y) и загрузка данных испытаний в (test_X, test_y)

  2. Поезд вашей модели с данными поезда

from sklearn.neighbors import KNeighborsClassifier
knn_clf = KNeighborsClassifier()
knn_clf.fit(train_X, train_y)
  1. Прогноз по данным испытаний
y_pred = model.predict(test_X)
  1. Проверка точности прогнозов
import numpy as np
accuracy = np.mean(test_y == y_pred)
...