sklearn: удалить класс большинства наугад, не тасуя набор данных - PullRequest
0 голосов
/ 21 февраля 2019

У меня есть набор данных изображения 48000, где 40k - нормальный класс и 8k - ненормальные экземпляры.Для того, чтобы сбалансировать набор данных, мне нужно провести выборку из класса большинства.Хотя я использовал метод случайной недостаточной выборки sklearn imblearn, который прекрасно работает, но мне нужно сохранить порядок строк (последовательность изображений) при удалении большинства экземпляров.

...