У меня есть два взаимно коррелированных набора данных. Коррелограмму можно увидеть ниже.
Значение задержки -2: -0,72.
Мои данные и код поезда / разделения указаны ниже. (Я знаю, что набор данных слишком мал, но скоро он станет намного больше, скажем, я готовлюсь к этому.)
data = {'A':[1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1], 'B':[0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 1]}
df = pd.DataFrame(data)
from sklearn.model_selection import train_test_split
y = df.A
X= df.B
train_X, test_X, train_y, test_y = train_test_split(X, y, random_state=1)
Я пытаюсь создать модель машинного обучения для классификации проблема. Как вы думаете, я могу использовать эти знания для создания своей модели?