После того, как я разбил свой несбалансированный набор данных в Python на набор тестов и тренировок, я захотел сделать выборку своих данных. Однако я получаю очень высокую точность, я также получаю
следующая ошибка:
/usr/local/lib/python3.5/dist-packages/ipykernel_launcher.py:33: UserWarning: Boolean Series key will be reindexed to match DataFrame index.
Мне нужно беспокоиться об этом? В моем наборе данных у меня есть 2724 0 и 351 1. Код, который я использовал для получения следующих данных:
df_majority = x_train[df_x.A==0]
df_minority = x_train[df_x.A==1]
df_majority_downsampled = resample(df_majority, replace=False, n_samples=351, random_state=123)
df_downsampled = pd.concat([df_majority_downsampled, df_minority])
Пример данных:
x A LA LO
1 0 -42,3333. 72,4567
2 1 -42,4500 72,2345
3 0 -42,2345 72,0000
4 0 -42,9090 72,7897
5 0 -42,7777 72,1234
Я хочу предсказать A