Как выполнить моделирование и классификацию Topi c для каждого комментария к предложению во фрейме данных в R? - PullRequest
0 голосов
/ 13 июля 2020

Есть ли способ сделать топи c моделирование и классификацию на фрейме данных комментариев в R?

У меня есть 10 столбцов комментариев (где каждый комментарий представляет собой открытое предложение топи c, связанных с вопросом), и я хочу классифицировать каждый из этих комментариев по topi c для каждого столбца комментариев.

Я попытался использовать LDA (скрытое распределение Дирихле), используя пакет topicmodels в R ( и использовать DocumentTermMatrix и Corpus до того, как я применил модель LDA). Я попытался найти оптимальное количество тем, используя наименьшее затруднение.

Проблема в том, что я не знаю, по какому топи c классифицируется каждое предложение комментария. Он помещает слова в похожую топи c, но не по предложениям. Так что это немного сбивает с толку.

Я не знаю, где go оттуда, и мне нужен совет, как это сделать.

Мне удалось применить сентиментальный анализ к тем же данным frame в R с использованием пакета sentimentr, и это сработало, но я не могу сделать то же самое для моделирования и классификации topi c.

Как я могу сделать это в R для каждого предложения комментария в столбце (для всего 10 столбцов)?

изображение данных

...