поэтому я хочу выполнить среднее целевое кодирование в Train & test Dataset после их разделения (используя стратификацию), и для этого нужно объединить их вместе.
как я могу это сделать?Любое предложение будет высоко ценится?Спасибо.
X_train, X_test, y_train, y_test = train_test_split(R,
target,
test_size=0.25,
random_state=7,
stratify=target)
print("Number transactions X_train dataset: ", X_train.shape)
print("Number transactions y_train dataset: ", y_train.shape)
print("Number transactions X_test dataset: ", X_test.shape)
print("Number transactions y_test dataset: ", y_test.shape)
Вот вывод:
Number transactions X_train dataset: (37779, 89)
Number transactions y_train dataset: (37779,)
Number transactions X_test dataset: (12593, 89)
Number transactions y_test dataset: (12593,)