Я работаю над набором данных приблизительно из 3000 вопросов, и я хочу провести целевую классификацию. Набор данных еще не помечен , но с точки зрения бизнеса существует требование идентификации приблизительно 80 различных классов намерений .Давайте предположим, что мои тренировочные данные имеют примерно одинаковое количество классов и не сильно смещены в сторону некоторых классов.Я собираюсь преобразовать текст в word2vec или Glove, а затем подать его в мой классификатор.
Мне известны случаи, когда у меня есть меньшее количество классов намерений, таких как 8 или 10, и выбор машиныучебные классификаторы, такие как SVM, naive bais или deeplearning (CNN или LSTM).
Мой вопрос заключается в том, что если у вас уже был опыт работы с таким большим количеством классов с намерениями, и какой из алгоритмов машинного обучения, по вашему мнению, будетвыполнять разумно?Как вы думаете, если я буду использовать рамки глубокого обучения, все еще большое количество меток приведет к снижению производительности, учитывая данные обучения выше?
Нам нужно начать маркировать данные, и довольно сложно найти 80 классовпомечает, а затем понимает, что это неэффективно, поэтому я хочу убедиться, что я принимаю правильное решение по , сколько классов намеренного максимума мне следует учитывать и какой алгоритм машинного обучения вы предлагаете?
Заранее спасибо ...