Как визуализировать следующий набор данных? - PullRequest
0 голосов
/ 27 июня 2018

У меня есть следующий набор данных, воспроизводимый на статистическом языке программирования R:

library(data.table)
sheet1 <- data.table(userID = c('abc123', 'abc123', 'abc123', 'def456', 'def456'), 
           sessionID = c('1529665492722.251rq8', 
                         '1529922427795.g2k607go',
                         '1529931067235.0yw5eqfa6', 
                         '1529945600035.345m7ym1', 
                         '1529950171742.fhmkcj6l'),
           month = '6',
           totalpageviews = c('10', '15', '56', '23', '24'),
           pagePath = c('application/123', 'application/456', 'application/789', 'application/101112', 'application/131415'))

sheet2 <- data.table(userID = c('abc123', 'abc123'),
                     sessionID = c('1529665492722.251rq8', '1529922427795.g2k607go'),
                     eventCategory = c('x', 'x', 'c'),
                     eventAction = c('y', 'z', 'a'),
                     pagePath = c('application/123', 'application/123', 'application/123'))

sheet1 и sheet2 имеют общие поля, а именно userID и sessionID. Я хочу представить данные коллеге, который не имеет опыта работы с электронными таблицами. Как я могу визуализировать данные таким образом, чтобы неопытный глаз мог извлечь информацию?

Я открыт для изучения различных вариантов. Это может быть R, Excel или инструмент BI, например Power BI.

1 Ответ

0 голосов
/ 27 июня 2018

Обучение занимает немного времени, но ggplot2 может дать вам много пробега. Проверить http://r4ds.had.co.nz/data-visualisation.html

Может также помочь преобразовать ваши sessionID в нечто упорядоченное или числовое, чтобы увидеть тенденцию временного ряда, если вы предпочитаете ее категориальным переменным, которые вы используете в настоящее время.

Вот как я мог бы визуализировать то, что у вас сейчас есть:

# install.packages('dplyr')
library(dplyr)
sheet <- full_join(sheet1, sheet2)

# install.packages('ggplot2') # visualization package
library(ggplot2)
# all data; bars including NAs and Event category/action
(p <- ggplot(sheet) +
  geom_col(aes(sessionID, totalpageviews, fill = interaction(eventCategory, eventAction)), position = 'dodge') +
  guides(fill = guide_legend(title = 'Event Category.Action')) +
  theme(axis.text.x = element_text(angle = -30, hjust = .3)))

# just application/123
(p2 <- p %+% (sheet %>% filter(pagePath == 'application/123')))

# just page views and page path
(p3 <- ggplot(sheet %>% select(totalpageviews, pagePath)) +
  geom_bar(aes(totalpageviews, pagePath), stat = 'identity', fill = scales::muted('blue')))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...