Я не мог найти решение этой проблемы, поэтому использовал регулярное выражение разбиения: -
X = df_clean[['previous', 'emp.var.rate', 'euribor3m', 'nr.employed',
'pdays_missing', 'poutcome_success' , 'poutcome_nonexistent','pdays_bet_5_15']]
y = df_clean['y_yes']
X_train, X_test, Y_train, Y_test = train_test_split(X, y, test_size = 0.2,
random_state=5)
print(X_train.shape)
print(X_test.shape)
print(Y_train.shape)
print(Y_test.shape)