Цель и инструменты
Сейчас я пытаюсь ознакомиться с пакетами R BTM
и textplot
, вот как для создания удобочитаемых и значимых визуализаций моделей biterm topi c (моделей BTM), созданных с помощью BTM
через textplot
. textplot::plot.BTM()
- это метод, который создает кластерную визуализацию моделей, созданных с помощью BTM::BTM()
. Как документация BTM::BTM()
, так и документация textplot::plot.BTM()
содержат примеры кода, предназначенные для построения графиков. Согласно документации, textplot::plot.BTM()
возвращает объект класса ggplot
.
Предыдущие попытки и наблюдения
После установки пакетов, упомянутых в этих примерах, а именно concaveman
, ggraph
и igraph
, я смог успешно воспроизвести эти примеры графиков. Кроме того, мои собственные графики выглядели как примеры.
Хотя, когда я начинаю с сеанса fre sh R и запускаю свой сценарий ( см. Минимальный код ниже ), мои графики внезапно выглядят достаточно разный. Цвета форм кластера и особенно краев больше не являются светлыми пастельными оттенками, как на демонстрационных графиках , а скорее темными и яркими оттенками, например темно-коричневым, который дает низкий контраст относительно черных маркеров ( см. Этот снимок экрана ). Кроме того, края стали очень толстыми, поэтому они закрывают и превосходят формы кластеров внизу. Таким образом, сюжет нечитаем и определенно выглядит сломанным.
Я заметил, что R выводит что-то вроде *
Load required namespace: ggraph
Load required namespace: concaveman
, когда я запускаю textplot::plot.BTM()
, хотя иногда по неизвестной причине упоминается только concaveman
. Вызов class()
указывает, что возвращаемое значение относится к классу ggraph
, который наследуется от ggplot
. Мне кажется, что эти пакеты правильно установлены и используются функцией при необходимости. Все задействованные пакеты обновлены, то есть установлены BTM
0.3.1 и textplot
0.1.2, чтобы явно указать версии основных пакетов.
- Я получил их на немецком языке и перевел буквально.
Мои вопросы
- Как я могу гарантировать, что мои сюжеты всегда выглядят так, как задумано, то есть имеют светлые пастельные оттенки и края соответствующего размера?
- Почему мои графики выглядят иначе, то есть имеют яркие темные оттенки и чрезвычайно толстые края?
- Дополнительный вопрос с точки зрения читаемости;) : Как я могу убедиться, что у всех токенов есть читаемый размер шрифта? Я заметил как на моем графике, так и на графике примера, что токены с низкой частотой очень маленькие и, следовательно, их трудно читать.
Большое спасибо за вашу помощь!
Это мой первый пост о stackoverflow , так что, пожалуйста, дайте мне знать, если я пропустил лучшие практики задавать вопросы.
Минимальный код
library(BTM)
library(textplot)
library(udpipe)
data("brussels_reviews_anno", package = "udpipe")
brussel_reviews <- subset(brussels_reviews_anno, language == "nl")
brussel_reviews <- subset(brussel_reviews, xpos %in% c("NN", "NNP", "NNS"))
brussel_reviews <- brussel_reviews[, c("doc_id", "lemma")]
btm_model <- BTM(brussel_reviews, k = 5)
plot(btm_model, top_n = 15,
title = "Topic Clusters of Top 15 Biterms",
labels = c("1 - Too dark color masking terms",
"2 - Looks okish",
"3 - Too thick edges",
"4 - Too thick edges",
"5 - Too thick edges"))