Я пытаюсь рандомизировать свои строки в кадре данных - данные перед применением линейной регрессии, но я понял, что результаты регрессии отличаются после рандомизации строк, что не должно быть? Коды, которые я пробовал использовать:
Without row randomisation:
data
X = data[feature_col]
y = data['median_price']
lr = LinearRegression()
lr.fit(X, y)
With row randomisation:
Method 1:
data = data.sample(frac=1)
Method 2:
data = data.sample(frac=1, axis=1)
Method 3:
from sklearn.utils import shuffle
data = shuffle(data)
Method 4:
data = data.sample(frac=1, axis=1).reset_index(drop=True)
Из 4 методов рандомизации строк, которые я пробовал, только метод 4 дает те же результаты, что и метод, в котором рандомизация не применяется. Я думал, что рандомизация строк не влияет на результаты регрессии в любом случае?