Разделите дисбалансированный (двоичный) набор данных, чтобы тестовый набор имел равное количество ложных и положительных выборок - PullRequest
1 голос
/ 17 апреля 2019

Я пытаюсь применить NN к проблеме двоичной классификации с высоким дисбалансом класса;28k False (0.) и 68k True (1.).Можно ли использовать стратификацию с train_test_split, чтобы гарантировать, что доля событий True и False одинакова в наборе тестов, но не в наборе поездов?Например;Тестовый набор - 14k False, 14k true.Набор поездов - 14k False, 54k True.

...