Приводит ли пересчет двух матриц одинакового размера к одному и тому же случайному состоянию к строкам с одинаковыми индексами? - PullRequest
0 голосов
/ 24 сентября 2019

У меня есть точки данных в матрице csr numpy и метки в серии панд.

Я хочу выполнить выборку из набора данных.

Я попытался повторно сэмплировать точки данных (матрицу) и метки (серии панд) отдельно, используя одно и то же случайное состояние.

X4_train_undersampled = resample(X4_train,replace=False, n_samples=41615, random_state=123) 
y_train_undersampled = resample(y_train, replace=False , n_samples=41615, random_state=123)

Я хочу узнать, является ли это правильным методом для этого,

если да, как я могу проверить, выбираются ли одинаковые строки в точках данных и в метках.

, если нет, укажите другой способ понижающей дискретизации.

...