Мои данные содержат ответы на открытый вопрос: по каким причинам рекомендуется рекомендовать организацию, в которой вы работаете?
Я хочу использовать алгоритм / технику, которая, используя эти данные, изучает категории(то есть причины), которые встречаются чаще всего, и что новый ответ на этот вопрос может быть автоматически помещен в одну из этих категорий.
Сначала я думал о моделировании темы (например, LDA), но текстовые документыв этой задаче очень мало (в основном от 1 до 10 слов на документ).Следовательно, это подходящий метод?Или есть другие модели, которые подходят для этого?Возможно, кластерный метод?
Примечание: текст на голландском