Учитывая имеющиеся у вас ограничения данных, тренировка классификатора (SVM или Random Forest) может оказаться не лучшим подходом, поскольку любая модель машинного обучения требует, чтобы несколько экземпляров класса изучали что-то, что можно обобщить . В то время как обучение классификатору SVM класса 6000 будет большой проблемой, Случайный Лес может легко найти хитрость для точной классификации каждой выборки в обучающих данных путем генерации определенных деревьев, но может вообще не работать во время тестирования.
Я предлагаючто вы играете больше с несколькими метриками расстояния - возможно, пытаясь построить ваши точки в более низких измерениях и, возможно, искать измерения, которые являются более информативными при выполнении классификации. Деревья решений иногда также используются для выбора объектов, исходя из этого, вы, вероятно, можете выбрать несколько измерений и, возможно, затем использовать свой тип евклидова расстояния.
Извинения за очень субъективный ответ. Хотя я не могу сказать, что именно может работать для вашей проблемы, я могу с уверенностью сказать, что обучение любому из упомянутых классификаторов было бы хорошей идеей для задачи распознавания. Я надеюсь, что это по крайней мере ответит на вопрос выбора, который у вас был.