У меня есть набор отзывов (комментарий в словах + рейтинг от 0-10), и я хочу создать облако слов настроения в R, в котором:
- Размер слова соответствует его частоте.
- Цвет слова представляет собой средний рейтинг всех отзывов, в которых оно встречается (предпочтительно цветовой градиент зелено-желто-красный)
Я использовал quanteda для создания dfm
комментариев. Теперь я думаю, что хочу использовать функцию textplot_wordcloud
, и мне нужно сделать следующее:
- Для каждого слова получите все отзывы, которые появились в
- Рассчитать средний рейтинг этого подмножества отзывов
- Разделите на 10 для масштабирования до 0-1 и присвойте это значение этому слову
- Сортировка слов по средней оценке (чтобы цвета были назначены правильно?)
- Используйте
color=RColorBrewer::brewer.pal(11, "RdYlGn")
для расчета цветов по средним рейтингам
У меня проблемы с шагами 1 и 4. Остальное должно быть выполнимо. Может кто-нибудь объяснить, как легко можно читать dfm
, манипулируя им?