Как показать метки данных на ggplot (geom_point) в R с помощью Power BI? - PullRequest
0 голосов
/ 25 марта 2020

Я пытаюсь сделать диаграмму geom_point в Power BI, используя R. Она показывает результаты 2 разных тестов. Я хочу, чтобы цвет точек по полу и метки данных были именем человека.

Это мой код:

na_strings <- c("Not Provided", "Decline To Self Identify")
dataset <- dataset %>% replace_with_na_all(condition = ~.x %in% na_strings) 

dataset$gender <- as.factor(dataset$gender)
dataset$`Candidate Full Name` <- as.factor(dataset$`Candidate Full Name`)

#chart:
ggplot(data = subset(dataset, !is.na(`gender`)), aes(x=`Numerical`, y= `Verbal`,  col = gender )) +
  geom_text(aes(label=`Candidate Full Name`), data=subset(dataset, !is.na(`gender`)), hjust=0, vjust=0, check_overlap = TRUE)+
  geom_point()  

Однако вместо пола и полного имени кандидата я получаю цифры: chart

Экспортированные данные непосредственно из визуала в Power BI выглядят следующим образом: csv

Есть идеи, почему и как это преодолеть?

Спасибо!

Ответы [ 2 ]

0 голосов
/ 04 апреля 2020

Я не знаю, почему R ведет себя по-разному при визуализации Power BI, но я подтвердил ту же проблему на моей машине. Это похоже на функцию replace_with_na_all . Проблема исчезла, когда я заменил эту строку, как показано ниже.

# dataset <- dataset %>% replace_with_na_all(condition = ~.x %in% na_strings)
dataset[dataset$gender %in% na_strings,"gender"] <- NA_character_
0 голосов
/ 25 марта 2020

что представляют цифры? Вы можете head набор данных? Я подозреваю, что ваше отображение данных неверно ...

...