У меня есть набор данных изображения 48000, где 40k - нормальный класс и 8k - ненормальные экземпляры.Для того, чтобы сбалансировать набор данных, мне нужно провести выборку из класса большинства.Хотя я использовал метод случайной недостаточной выборки sklearn imblearn, который прекрасно работает, но мне нужно сохранить порядок строк (последовательность изображений) при удалении большинства экземпляров.