У меня есть набор данных для испытаний и обучения измерений
train.shape
test.shape
(589962, 24)
(820, 24)
, где столбец индекса ID
, а целевой столбец Result
Для отдельных данных Чтобы разделить на поезд и проверить, мы делаем это
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(df[list_of_X_cols], df['Result'], test_size=0.33, random_state=42)
Но как разделить для двух разных наборов данных с разными размерами ??