Как восстановить X_test и y_test & x_train и y_train после расщепления с помощью sklearn? - PullRequest
0 голосов
/ 20 мая 2019

поэтому я хочу выполнить среднее целевое кодирование в Train & test Dataset после их разделения (используя стратификацию), и для этого нужно объединить их вместе.

как я могу это сделать?Любое предложение будет высоко ценится?Спасибо.

   X_train, X_test, y_train, y_test = train_test_split(R,
                                                target,
                                                test_size=0.25,
                                                random_state=7,
                                                stratify=target)  
   print("Number transactions X_train dataset: ", X_train.shape)
   print("Number transactions y_train dataset: ", y_train.shape)
   print("Number transactions X_test dataset: ", X_test.shape)
   print("Number transactions y_test dataset: ", y_test.shape)

Вот вывод:

   Number transactions X_train dataset:  (37779, 89)
   Number transactions y_train dataset:  (37779,)
   Number transactions X_test dataset:  (12593, 89)
   Number transactions y_test dataset:  (12593,)

1 Ответ

0 голосов
/ 20 мая 2019

Вы можете объединить свои массивы по строкам:

X_combined = np.r_[X_train, X_test]
y_combined = np.r_[y_train, y_test]

Вы можете увидеть дополнительную глубину в других SO вопросах.

...