Если вы хотите перетасовать и разделить данные с коэффициентом 0,3, вы можете использовать
sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, shuffle=True)
, где X - ваши данные, y - соответствующие метки, test_size - это процент shuffle = True перемешивает данные перед разделением
. Чтобы обеспечить равномерное распределение данных по столбцу, вы можете указать это к параметру стратификация .
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
shuffle=True,
stratify = X['YOUR_COLUMN_LABEL'])