Размер набора данных: 81256, Классы: 200, Диапазон для каждого класса варьируется от 2757 для определенного класса до всего лишь 10 для определенного класса. Он крайне несбалансирован. Как сбалансировать этот набор данных и какой тип алгоритма следует использовать для обучения модели. Прямо сейчас я использовал случайный over-sampler для выборки и Linear SVC для обучения модели.