Как я могу изменить свои тестовые данные в Sklearn? (выбор функции) - PullRequest
0 голосов
/ 06 февраля 2020

У меня есть два набора данных, один для обучения и другой для тестирования:

  • Данные обучения имеют X_train.shape = (5000, 30) и y_train.shape = (5000, 1)
  • Только данные тестирования имеют X_test.shape = (5000, 30)

В обучающей программе я применяю выбор объектов (SelectKBest()), в результате чего получается новая форма (5000, 10).

Проблема начинается с данных тестирования: нет вывода, поэтому я не могу применить SelectKBest(), потому что для этого требуется y_test. Как я могу изменить форму тестовых данных, учитывая новую форму и новые функции моих тренировочных данных?

1 Ответ

1 голос
/ 06 февраля 2020

Легко продумать склеарн трансформаторы. В комментариях вы спросили

Могу ли я использовать get_support (True) для получения значений индекса ...

Это слишком много работы! Попробуйте

best=SelectKBest(*args).fit(X_train,y_train)
new_train=best.transform(X_train)
new_test=best.transform(X_test)

так же, как если бы вы использовали тфидтрансформатор или стандартную шкалу

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...