Есть ли способ сделать топи c моделирование и классификацию на фрейме данных комментариев в R?
У меня есть 10 столбцов комментариев (где каждый комментарий представляет собой открытое предложение топи c, связанных с вопросом), и я хочу классифицировать каждый из этих комментариев по topi c для каждого столбца комментариев.
Я попытался использовать LDA (скрытое распределение Дирихле), используя пакет topicmodels в R ( и использовать DocumentTermMatrix и Corpus до того, как я применил модель LDA). Я попытался найти оптимальное количество тем, используя наименьшее затруднение.
Проблема в том, что я не знаю, по какому топи c классифицируется каждое предложение комментария. Он помещает слова в похожую топи c, но не по предложениям. Так что это немного сбивает с толку.
Я не знаю, где go оттуда, и мне нужен совет, как это сделать.
Мне удалось применить сентиментальный анализ к тем же данным frame в R с использованием пакета sentimentr, и это сработало, но я не могу сделать то же самое для моделирования и классификации topi c.
Как я могу сделать это в R для каждого предложения комментария в столбце (для всего 10 столбцов)?
изображение данных