У меня есть точки данных в матрице csr numpy и метки в серии панд.
Я хочу выполнить выборку из набора данных.
Я попытался повторно сэмплировать точки данных (матрицу) и метки (серии панд) отдельно, используя одно и то же случайное состояние.
X4_train_undersampled = resample(X4_train,replace=False, n_samples=41615, random_state=123)
y_train_undersampled = resample(y_train, replace=False , n_samples=41615, random_state=123)
Я хочу узнать, является ли это правильным методом для этого,
если да, как я могу проверить, выбираются ли одинаковые строки в точках данных и в метках.
, если нет, укажите другой способ понижающей дискретизации.